社会研究方法复习资料 下载本文

概论

一、社会研究中的一些辨证关系

1、个案式和通则式解释模式

个案式解释——一种解释方式,在这种解释方式中,我们试图穷尽某个特定情形或是事件的所有原因。

通则式解释——一种解释方式,在这种解释方式中,我们试图寻找一般性地影响某些情形或者事件到原因。

2、归纳与演绎理论

归纳——在这种逻辑模型中,普遍性的原理是从特定的观察中发展起来的。即是从个别出发以达到一般性,从一系列特定的观察中,发现一种模式,在一定程度上代表所有给定事件的秩序。

演绎——在这种逻辑模型中,特定的命题来自普遍性的原理。即从一般到个别,从(1)逻辑或理论上预期的模式到(2)观察检验预期的模式是否确实存在。

3、定量与定性资料

定性研究(导论P133)——是一种将观察者置于现实世界之中的情景性活动。它由一系列解释性的、使世界可感知的身体事件活动所构成,这些事件活动转换着世界。它将世界转变成一系列的陈述,包括实地笔记、访问、谈话、照片、自然主义的方式。这意味着定性研究者实在事物的自然背景中来研究它们,并试图根据人们对现象富玉的意义来理解或来解释现象。

局限:依据典型的或少量个案的资料得出的结论不一定具有普遍性。主观性的分析或结论缺乏客观的评价标准,因此无法对不同的研究结论进行检验。

定量研究——从一组单位中收集各单位的可以对比的信息。

优点:普遍性、客观性和可验性。标准化和精确度较高,逻辑推理比较严谨。能大大推进理论的抽象化和概括性促进对现象之间普遍的因果关系的精确分析。

局限:1.对大量样本的少数特征做精确的计量,因而很难获得深入、广泛的信息,容易忽略深层的动机和具体的社会过程。

2.社会现象错综复杂,影响因素众多且难于控制,要确立两个变量之间的因果关系并不容易,研究的现象越复杂,统计分析与相关分析就越不可靠。

3.由于社会现象的独特性,许多都无法得出普遍性都经验概括,因而无法依赖定量分析

定性研究与定量研究的不同(定性研究1P11): 1.实证主义和后实证主义的效用 2.后现代敏感性的认同

定量的、实证主义的方法和假设的运用,被新一代的定性研究者所拒绝,他们认为后结构的和/或后现代的敏感性更为重要。批判理论、建构主义、后结构主义以及后现代思想学派的许多成员都拒绝实证主义的和后实证主义的标准,他们把这些标准看作与他们的工作无关,认为这种标准事实中复制一种类型的科学,即那种压制太多声音的科学。这些研究者寻求评价他们工作的替换方法,包括逼真性、情绪性、个体的反应性、人道的伦理、政治的惯例、多种声音的文本以及对象的对话等。

相对应的,实证主义者和后实证主义者认为他们所做的是排除了个人偏见和主观性的好的科学。他们将后现代主义和后结构主义看作是对推理和真实的攻击。 3.捕获个体的观点

定性研究者和定量研究者都关注个体的观点。但定性研究者认为他们通过详细的访问和观察,可以更加接近行动者的视野。他们认为定量研究者很少能够捕获他们的对象的视野,因为他们不得不依靠更为远距离到、推论性到经验方法和材料。由解释性方法所产生到经验材料被许多定量研究者看作是不可靠到易受影响的和不客观的。

4.考察日常生活的限制

定性研究者更有可能面临和遇到日常社会世界的限制,他们将这个世界看作是在运转的,并将他们的结论嵌入其中。定性研究者致力于一种主位的、具体的、基于个案的立场,这一立场将他们的注意力引向特定个案的特殊性上。

定量研究者从这个世界中进行抽象,很少直接地对其进行研究,他们寻求一种建立在由大量随机选择到个案所导出地概率基础之上地客位的、发现普遍规律的科学,这种陈述高高在上,并在日常生活的限制之外。

5.获得丰富的描述

定性研究者相信对社会世界的丰富描述是有价值的,而定量研究者带着他们客位的、关于普遍规律性的允诺,很少关注这种细节,定量研究者有意地不关注这种丰富地描述,因为这种细节打断了他们概括的过程。

4、纯粹研究与应用研究

二、社会研究的伦理(导引P102)

1、自愿参与 2、对参与者无害

自愿参与和不伤害参与者已经越来越正式化,形成了“知情同意”——这种规范要求,基于自愿参与的原则而进入研究的对象,必须完全了解他们可能受到的危害。 3、保护研究者权益(匿名与保密)

匿名——当研究者和读者都不可能将回答和回答者对应起来时,这个研究就可以说达到了匿名的要求。

保密——当研究者能够指认特定研究对象的回答,但是承诺不会将其公开时,该研究就达到了保密的要求。

任务报告——和对象交流,让他们了解其在研究中的经历。当存在伤害参与人的可能性时,这种报告是尤为重要的。

三、社会研究的政治蕴含(社会研究方法P75)

伦理问题与政治问题的区别:首先,社会学研究中的伦理争议大多与研究方法有关,政治观点的争议则发生在研究的性质和运用中。其次,伦理争议存在着正式的行为规范,而现实社会没有一种能让社会学家一致接受的政治规范。

四、两种逻辑体系

1、科学的传统模式(三步法、运用的时演绎逻辑)

首先,对真实世界的某些方面产生兴趣,提出理论 假设——关于经验事实的可检验的特定期望,它遵从更为一般性的命题;更为一般地说,它是关于来自理论的事物的本质的期望。是关于在现实世界中应该能够观察到什么的期望——假定理论是正确的话。 其次,检验假设是否成立: 1.对假设中的变量进行定义

2.说明如何测量变量,即 操作化——走出概念化的一步,是发展操作定义的过程,或是对在测量变量时所用到的精确操作的说明。

3.说明变量的意义,即操作定义——根据对观察进行分类的操作而做出的具体的、特定的定义。

零假设——与假设检验和统计度显著检验相关的假设,该假设认为政治被研究的变量之间不存在相关关系。在统计上否定了零假设之后,就可以得出结论,认为变量之间是相关的。

最后,观察现实世界并测量所看到的现象。接受或拒绝假设。

2、归纳推理

观察——寻找模式——获得结论

研究设计

一、目的

1、探索

探索性研究也成先导研究,是对某一课题或某一现象进行初步了解。既可以作为一项独立的研究,又可以为进一步周密、深入的研究工作准备。

目的: A.满足研究者的好奇心和对某事物更加了解的欲望; B.探讨对某议题进行细致研究的可行性; C.发展后续研究中需要使用的方法。

缺点:很少圆满地回答研究问题,尽管它可以为获得答案和寻求确切答案到研究方法提供线索。

2、描述

描述性研究的目的是系统地了解某一社会现象的状况及发展过程,它通过对现状的准确、全面的描述来解答社会现象“是什么”的问题。 3、解释

试图对社会现象做出普遍的因果解释,以解答“为什么”。

二、通则式研究的解释逻辑

通则式因果关系的准则:

(1)变量之间必须相关——两个变量之间的经验关系,如一个变量的改变影响到另一个变量的改变,或者一变量的特定属性跟另一变量的特定属性相关。相关本身并不意味着两变量之间的因果关系,但确实因果关系的一个标准。 (2)原因必须先于结果发生。

(3)非虚假关系——两变量之间巧合性的统计相关,其实是由第三个变量引起的。

三、必要原因—充分原因

四、分析单位(研究什么和研究谁)

(1)个体 (2) 群体 (3)组织

(4)社会人为事实(social artifacts)——人或其行为的产物。

分析单位的错误推理:

区位谬误——在只对群体进行观察的基础上,错误地得出个体层次上的结论。 简化论——局限于只将某些类型的概念应用于被研究的对象。

五、研究的时间维度

截面研究——以代表了某个时间点的观察为基础的研究。是对一个代表某一时间点的总体或现象的样本或截面的观察。探索性和描述性研究通常都是截面研究。

历时研究——该研究设计需要收集不同时间点的数据。是一种跨时段观察同一现象的研究方法。 趋势研究——一种历时研究,其中总体的某些特征一直得到研究——每一时点都采访不同的样本。是对一般总体内部历时变化的研究。

世代研究(同期群)——研究者历时性地研究特定亚总体。尽管在每次观察中,数据可能是从不同到成员中收集的。

专题群体研究——一种历时研究,其中的数据是从不同的时间点的同一批对象收集起来的。能提供随时间变化的综合性资料,但样本量减损会导致差异。

六、社会研究的具体步骤 1、确定研究课题或假设 2、设计研究方案

(1)概念化——细化所要研究的概念和变量的含义,将模糊的、不精确的观念(概念)明确化、精确化的思维过程。

1.概念的界定:用抽象定义将概念所指的现象与其他现象区分开来。

2.选择测量指标:确定如何测量变量,选用哪些指标(我们所选择的观察,它反映我们所要研究的变量)来测量。

3.编制综合指标

概念的具体化过程就是一步步从抽象层次下降到经验层次,使概念具体化为可观测的事物。 (2)选择研究方法 (3)操作化

建立一些具体的程序或指标来说明如何测量一个概念(变量)。决定如何收集我们所要的资料:直接观察、阅览官方文件、使用问卷,或是其他技术。

(4)确定研究总体 (5)观察(收集资料) (6)资料处理 (7)资料分析 (8)得出结论并应用

七、研究计划书

基本要素:议题或目的,文献回顾,研究对象,测量,资料收集方法,分析,时间表,经费

研究的建构

一、概念化 1、指标与维度

维度——概念的一个可指明的方面,概念的具体层面或具体方面。区分概念的不同维度可以加深我们对研究事物的了解。

指标互换性——如果多个不同的指标或多或少代表了同一概念,而这个概念既真实又可被观

察,代表这些指标的行为就会与代表这个概念的行为一致。 2、真实定义、名义定义与操作定义

真实定义反映了术语的具体化,试图制定概念“真实”的努力只会导致困境:将概念结

构错当成了真实的实体。

详述——使得概念更为明确的过程。依赖于名义定义和操作定义。 名义定义——指某个术语被赋予的意义,无需指标真实,是任意的。

操作定义——明确、精确地规定了如何测量一个概念,即如何操作。更接近于名义而非

真实定义。 3、概念次序的建立

二、操作化选择

1、变量应该包含的两个要素:

(1)变量的属性要有完备性。一个变量要对研究产生效用,组成该变量的属性就应该涵盖所有能够观察到的情况。

(2)变量的各个属性应具有“互斥性”。要将观察结果纳入某个唯一的属性。

2、测量层次:

定性测量——在该测量层次下,变量的属性只有完备性和排他性特征。即该测量层次只是描述了属性之间的差异——这也是其与定序、定距、定比测量的区别。

定序测量——该测量层次描述了变量的属性沿着某个维度的排行序列。不同的属性代表了变量的相对多寡程度。

定距测量——该测量层次所描述的变量的属性可以排序,而且相邻属性之间的距离时相等的。

定比测量——该测量层次不仅描述了定性、定序和定距测量所提到的属性,另外还是以“真实的零”为基础的。

三、评估测量质量的标准

1、精确性和准确性

2、信度——指的是测量方法的质量,即对同一现象进行重复观察是否可以得到相同的资料。 (1)前测—后测法 (2)对分法(5:5) (3)利用已有的测量法

(4)工作人员的信度:测量缺乏信度也可能是工作人员所致,由多种方法来检查这种信度,如复证。此外明确、具体、训练和练习都是避免出现信度问题的有效方法。 3、效度——指的是测量准确地反映了需要测量到概念。

表面效度——衡量一个指标到品质,即该指标看起来是否能对某变量进行合理测量。 标准关联效度——某测量与外在标准相关的程度。

建构效度——在某理论体系内,某测量与其他变量相关的程度。

四、指标、量表和分类法 1、指标和量表

指标——一种复合测量,它包含了多个具体的观察,并代表着一些更一般的维度。

量表——一种复合测量,由多个具有逻辑结构或是经验结构的项目组成。量表的例子包括鲍嘎得社会距离量表、瑟斯东量表、李克特量表、哥特曼量表。

相同:指标和量表都是典型的对变量的定序测量,既根据具体变量(如信仰虔诚度、疏离性、社会经济地位、偏见或是智商等)的分析单位进行排序。

区别(通过分值分配方式):

指标往往通过单个属性到分值积累来建立,如通过加总受访者赞成的偏见陈述的数量来测量偏见;

量表的建立则是通过对问题的不同反应模式赋予相应的分值,使不同选项反映变量变异程度的强弱。量表利用了任何存在于各种属性之间的差别。

一般而言,量表优于指标,因为量表能测量变量的强弱程度,量表分值所表达的信息比指标多。

2、指标的建构 (1)项目选择

1.表面效度——选择指标项目的首要标准使表面效度(或称为逻辑效度);

2.单一维度——指标还应具有单一的维度,如反映宗教虔诚度的项目绝对不能包括在测量政治保守程度的项目中,即使两者有经验上的相关度;

3.变异值——选择某个指标项目时,应该注意项目之间的变异值,如就有关政治保守度的项目而言,应该更多注意被归类为政治保守的受访者所占的整体的比例,如果结果显示无人被归类为保守者或每一个都时保守者,则上述项目对于指标的建立而言就没有用处。

为了确保项目之间存在变异,可以考虑两种方式:

第一,可以根据受访者对某变量多个项目的回答将其分为多个大小相同的群体:如一半是

保守派一半是自由派。

第二,选择彼此有差异的项目。这点对于指标和量表的制定都是不可或缺的。

(2)经验关系的检验(社会研究方法P153)

指标建立的第二个步骤是必须考察项目之间的经验关系。如果两个项目之间是经验相关的,我们就可能合理地人为两者都反映了同一变量,也就可以将它们放在同一指标里。

项目之间,存在两种类型地可能关系: 1.二元关系——就是两变量之间地关系。

如果项目之间没有关系,则这两个项目就不是在测量同一个变量。因此,如果某个项目与其他所有项目都不相关,则该项目就应该被排除在考虑之外。

如果两个项目之间有很强地关系或完全相关,在建立指标时就只需要保留其中一个项目,因为被保留的项目能够完全涵盖另一个项目所表达的意义

2.多元关系

(3)指标赋值

在选定了指标的最适当的项目之后,就可以对不同的回答选项赋予分值,以建立单一的复合指标。在这个步骤中包括两个基本决策:

1.必须确定指标分值的范围。指标相对于项目的最主要优势,就是它可以测量变量的变异程度。(1)指标应该有一个范围;(2)指标范围内每一点应该有组都的样本数

2.给每一个回答选项赋值。首先要确定的时给每一个回答选项相同的还是不同的权重(使用不同的权重时必须有确切的理由,一般做法时使用相同的权重),如果指标代表的是某个变量不同方面的复合情形,那么每个方面就应该有相同的权重。此外也要考虑到样本的分布状态。

3.赋值方法的选择一定是协调各种要求的结果。

(4)处理缺损资料

首先,如果缺损资料的样本量很少,在建立指标和分析资料时就可以剔除这些样本。(会造成研究结果代表性的误差)

其次,可以根据既有的回答来处理缺损资料。如通常选择“是”,“否”的回答空着。 第三,如果仔细地分析缺损资料,也能了解其含义。

其他,如某一项目可能有多种分值,缺损资料分值就应该是分值范围的中间值。或用随机方式给缺损资料赋值。如果用多个项目创造指标,则可以用观察值的比例值来取代缺损资料。 最好最安全的方法,就是用其他方法建构指标,看看是否有同样的发现。不管怎么说,理解资料才是最终的目的。

(5)指标的鉴定

鉴定的基本逻辑是该复合指标可以用于测量变量,即可以根据不同样本所得到的指标分值进行等级排序。

1.项目分析

指标鉴定的第一步,即内在鉴定,被称为项目分析——评估复合测量中所包含的每个项目是具有独立的贡献还是只是复制了其他项目的贡献。

2.外在鉴定——通过检验某测量(如指标或者量表)和测量同一变量的其他指标之间的关系来判断该测量的效度。

指标无法通过外在鉴定有两种可能:(1)指标无法充分测量变量 (2)检验项目无法充分测量变量,进而无法检验指标。首先应该重新考察指标本身,谈后再看是否因为外在鉴定项目与指标中个别项目有关系,与另一些指标没有关系,那么就会增强对建立指标的理解。

3、量表的建构

(1)鲍嘎德社会距离量表——用于判断人们进入其他类型对社会关系的意愿的一种测量技术,长项在于能够在不丢失原始信息的同时汇总多个不连续的回答。

如:假设要探讨美国人与阿尔巴尼亚人交往的意愿,可能会询问美国人如下问题: 1.你愿意让阿尔巴尼亚人住在你的国家吗? 2.你愿意让阿尔巴尼亚人住进你的社区吗? 3.你愿意让阿尔巴尼亚人住在你家附近吗? 4.你愿意让阿尔巴尼亚人住在你的隔壁吗? 5.你愿意让你的孩子与阿尔巴尼亚人结婚吗?

该量表的项目在强度上有明显差别,且程递进,说明了量表作为资料压缩工具的经济性。

(2)瑟斯东量表——一种复合测量,根据“裁判”对变量的指标给出的权重来建构。其试图在变量的指标项目之间建立一种经验性结构,其中最常出现的是“等距”结构。

使用频率不高,只要原因在于项目的确定必须有10-15个裁判对项目打分,需要花费大量的时间精力,裁判的质量取决于它们对变量的认识和经验,只有专家才做得到。再者,组成变量的项目的含义也会随时间的演进而有所改变,某个项目可能在不同的时候有不同的分值,为增进量表效果就需要每隔一段时间进行更新。

(3)李克特量表——李克特发展出来的复合测量类型,它试图通过在问卷调查中使用标准化的回答分类来提高社会研究的测量层次,并一次来决定不同项目的相对强度。李克特项目就是利用诸如非常同意、同意、不同意、非常不同意这样的回答来分类。这些项目在李克特量表的建构中会用到,同时也可以用在其他类型的复合测量中。

(2)语意差异——受访者被要求根据两个相反意义的形容词来评价某事的一种问卷格式。其中会用到一些限定词来连接这两个形容词,比如“十分”、“有些”、“都不”、“有些”和“十分”。

愉悦的 简单的 十分 有些 两者皆 有些 十分 不悦的 复杂的 不和谐的 传统的

和谐的 现代的 (3)哥特曼量表——用于总结多个不连续的观察的一种复合测量,它代表了一些更加概括的变量。

其逻辑基础是,受访者主要支持某个较强的变量指标,就一定会支持较弱的指标。该量表的基础是真实观察资料的结构,能够构成哥特曼量表的只是那些被用于分析的一组资料。

4、分类法——根据两个或多个变量的属性来对观察进行分类(典型地体现在定性研究中)。比如,将新闻分为自由主义—城市,自由主义—农村,保守主义—城市,保守主义—农村。(当作自变量来分析不会有什么问题,但当作因变量来分析,问题就会非常大)

五、抽样逻辑(研究设计与社会测量导引P54)

1、两种抽样方法

概率抽样——根据概率理论来选择样本的方法的总称。一些随机选择机制就是典型。具体的概率抽样类型包括EPSEM、PPS简单随机抽样和系统抽样。

非概率抽样——抽取样本的方式并不依据概率理论。比如就近抽样、目标式(判断式)抽样、配额抽样和滚雪球抽样。

2、非概率抽样

(1)就近抽样——指研究者将在一定时间、一定环境里所能遇见到或接触到的人均入选样本的方法。

优点:方便省力 缺点:样本的代表性差,有很大的偶然性

(2)目标式或判断式抽样——一种非概率抽样,其选择观察对象的方式是以个人的判断(对象是否最有效或者最有代表性)为基础的。

在无法确定总体边界,或因研究者的时间和设备有限而无法进行概率抽样时,可选用。其目的作用是发现问题,提出假设,而不是在于对总体做出概括。

(3)配额抽样——一种根据预先了解的总体特征来选择样本的方法,这样就能保证样本的特征分布和所要研究的总体一样。

与分层抽样中的比例抽样相似,也是按照调查对象的某种属性或特征将总体中所有个体分成若干类或层,然后在各层中抽样,样本中各层所占比例与他们在总体中所占比例一样,但不同的是,分层抽样中各层样本是随机抽取的,而定额抽样中各层样本是非随机抽取的。

定额抽样假定:(1)只要类型划分细,那么同一个类型中的每一个个体都是同质的,因而无需采用随机抽样。(2)只要类型划分合理,而且分配给各类的名额复合总体中各类人员的分布,

那么样本就可以准确地反映总体。但这两个假定在实施过程中很难做到,一方面在分层时不可能同时兼顾总体地众多属性,而只能考虑其中几种,因此不可能做出很细的分类,另一方面,有关总体分布变化的最新信息并不容易得到,因而配额的合理性很难保证,这些都会影响样本代表性

(4)滚雪球抽样——一种经常用于实地研究的非概率抽样方法:每个被访问者都可能被要求介绍其他的人来参与访谈。

在特定总体的成员难以找到时,时最合适的一种方法。

(5)选择线人——对你所渴望研究的社会现象相当熟悉的人,而且他还愿意告诉你他所知道的,注意不要和受访者混为一谈。线人应该时研究对象的群体中具有代表性的人物。

3、概率抽样的逻辑

背后的观念:要对总体进行有用的描述,从该总体中抽样出来的样本必须包含总体的各种差异特征。

(1)有意识与无意识的抽样误差 (2)代表性与选择概率

代表性——就是样本具有跟其所从中挑选出来的总体相同的特征。通过对样本的分析所得出来的描述和解释也同样适用于总体。代表性给概化和推论统计提供了可能性。在概率抽样下,代表性会更好。

EPSEM(等概率抽样方法)——在这种样本设计中,总体中的每个成员都具有相等的被选进样本的机会。即如果总体中的每一个体被抽取为样本的概率相同,那么从这个总体中抽取的样本就具有对该总体的代表性,具有这一性质的样本通常被称为EPSEM。 概率抽样的优点:

1.概率抽样虽然无法完美地代表总体,但较其他抽样方法更具代表性,因为它能避免我们讨论过的各种偏见。

2.概率理论使我们能够估计样本的精确度及代表性 (3)随机选择

要素——构成总体的单位,也是样本所包含的内容。要注意区别资料分析中的分析单位。 总体——理论上研究要素的特定集合体。 研究单位——从中选抽出样本的全体要素总和。

抽样单位——在一些抽样阶段所要考虑到的要素或者某组要素。

抽样的最终目的:

通过抽样方法从总体中选择一些要素,并通过对这些要素的描述(统计值)以精确描绘样本总体的各种特征。概率抽样使这一目标更易于实现,并能提供方法以估计成功的程度。随机抽样是这一过程的核心。

采用随机抽样的原因:

1.这一过程可以避免研究者自觉或不自觉的偏见。

2.随机抽样为我们进入概率理论提供了契机,而这一理论提供了估计总体参数和抽样误差的基础。

(4)概率理论、抽样分布和抽样误差评估

概率理论——是数学的一个分支,为研究者提供了设置抽样技术和分析样本结果的工具。更一般地说,概率理论为估测总体参数提供了基础。关键就在于抽样分布。

概率——又称或然率、机会率或机率、可能性,是数学概率论的基本概念,是一个在0到1之间的实数,是对随机事件发生的可能性的度量。 参数——对总体中的某变量的概括性描述。

(5)样本分布和抽样误差的评估

统计量——对样本中的变量的概括性描述,并被用来估测总体参数。 抽样分布的问题:

1.如果我们由总体内随机抽取许多独立的样本,这些随机抽样所得到的统计结果将以一种可知的方式分布在总体参数附近。

2.概率理论也提供给我们计算公式,以估计这些样本统计值与真实值的差距。也就是说,根据概率理论,我们能够估算抽样误差(sampling error)——概率抽样中的误差程度。决定抽样误差的公式包括三个因素:参数、样本规模和标准误。(社会研究方法P190)

(6)置信区间和置信水平

置信水平——总体参数值落在一既定置信区间的估测概率。比如我们有95%的信心说35-45%的投票者会支持候选人A

置信区间——估测总体参数值的范围。

4、总体与抽样框

抽样框——是总体要素的列表或准列表。要保证样本对总体的代表性,抽样框就要包含所有的(或者接近所有的)总体成员。

1.抽样框必须和我们所要研究的总体是一致的;

2.经过正确抽样所得的样本信息,只适合于描述构成样本框的要素组成的总体,不能再扩展;

3.即使总体与抽样框是一致的,为了说明组成抽样框的总体,所有要素必须具有同等的代表性:基本上,所有的要素应该只在名单中出现一次。在名单中出现多次的要素会有比较大的机会被抽到,因此,这样的调查结果将会有偏差。

5、抽样设计的类型

(1)简单随机抽样(SRS)——在这种概率抽样中,代表着总体的单元用一个数字来代替,这样就有了一个随机数字表。在挑选样本时直接选取这些数字即可。

这种方法很少用,原因:1.除了简单随机抽样方法以外,还有其他方法可以选择;2.这种方法可能并不是最精确的。

缺点:工作复杂、费用高、费时,在总体异质性较高时误差较大。

(2)系统抽样——选择完整名单中的第K个要素组成样本的概率抽样方法。用总体数量除以K就是样本规模。K就是抽样间距。在某些情况下系统抽样与简单随机抽样方法几乎是一致的,还比较简单易行。第一个要素通常都被随机选中。

抽样间距——从总体中选取样本的标准距离。

抽样比率——被选择的要素与所有总体要素数量的比率。 优点:1.比简单随机工作量少,简单易行。

2.样本在总体中的分布更均匀,抽样误差小于或之多等于简单随机抽样,较其更精确 缺点:如果总体的排列出现有规律的分布是,就会使系统抽样产生很大误差,即周期性误差,降低样本的代表性。

(3)分层抽样——在抽样之前将总体分为同质性的不同群或层。这一程序能够提高样本的代表性(起码就分层变量而言是这样的),它还可以和简单随机抽样、系统抽样或整群抽样结合起来使用。适用于总体内个体数目较多,结果较复杂,内部差异较大。

分层的最终功能,在于将总体分成几个同质的次集合(之间有异质性),然后从每个次集合中抽出适当数量的样本。分层变量的选择方法通常依赖于现有的变量,如从名单中分辨出性别等。

除选择适当的分层变量外,提高分层样本的精确度还必须力求符合分层的原则,即尽可能使各层内部保持同质,以简化总体的构造,使各层之间具有明显的差异性,以便包括总体的各种特性。样本的精确度还于分层数目及样本大小密切相关,分层越细,样本越大,则样本的代表性越好。

优点:1.提高代表性,同时减少可能的抽样误差。

2.有些研究不仅要了解总体的情形,还要了解某些类别的情形,该抽样方法可以同时满足这两个要求。此外,对总体的不同不分还可以采用不同的抽样方法。

(4)多级整群抽样——只要该群(丛)被选中,则该群中的所有成员都进入随后的子样本,比如,你可以先从目录中选择美国的大专院校,然后丛被选中的大学的学生名单中挑选学生样本。适用于界质不清的总体。

原则:使各个群间的异质性低,而群内的异质性高。不同于分层抽样。并且尽可能地多选取群,而减少每个群中要素到数量。

优点:1.可以通过转换抽样单位扩大抽样的应用范围; 2.可以节省人力、财力,效率高。 缺点:样本分布不均匀,样本的代表性差。

有两次误差:对整群进行的初次抽样只在一定的抽样误差范围内代表整群所组成的总体;对其中任何一个被选中的群体的要素进行抽样,同样是在一定的抽样误差范围内代表该群的所有要素。

多级整群抽样中的分层:每一个阶段到抽样,都可以使用分层法。一个被选取的群的要素,也可以在被进一步抽样之前加以分层。

概率比例抽样——一种更为成熟的多级整群抽样形式,其中的群被选取的概率并不相等,其被选中的概率和其规模大小——根据其子样本的数量来衡量——成比例。当抽样的群的规模很大时,就应当采用这种修正的抽样设计。

(5)非比例抽样和加权

加权——赋予不同概率入选样本的要素不同的权重。最简单的,每个样本要素的权重为其被选中概率的倒数。当所有的要素入选样本的几率相同时,也就无需加权。当所有样本要素被选中的机会都相同时,每个要素被赋予的权重也相同,即为1。这叫做“自加权”样本。

观察的方式

一、实验法

1、古典实验(三对主要成分) (1)自变量与因变量

自变量时试验中的刺激因素,或有或无,时具有两种属性的“二分变量”,在典型的实验模型中,实验者就是要比较出现刺激和不出现刺激所导致的结果的差异。

自变量与因变量都要根据实验目的进行操作化,这种操作化界定涉及大量的观察方法。

(2)前测与后测

前测——对因变量的测量。

后测——在接受自变量的刺激之后因变量的测量。

因变量前后测之间的差异,被视为自变量的影响力。

(3)实验组与控制组

实验组——在接受自变量的刺激之后因变量的测量。

对照组——在试验中没有被施以刺激的受试者,但是在其他方面则和实验组一样。对照组和实验组的比较是要发现实验刺激的效果。

双盲实验——受试者和实验者都不知道哪些是实验组哪些是对照组的一种实验设计。

2、选择受试者 (1)概率抽样

少于100的随机样本代表性不够,而社会科学的实验很少包括那么多的受试者,因此,这种方法很少采用。

(2)随机化——随机地将受试者分为实验组和对照组的方法。

(3)配对——在试验中,考察这些初选受试者的一个或多个特征,将一对相似的受试者随机分别分到实验组和对照组。

(4)随机化方法与配对方法的比较

随机化方法的优点:因为无从知道哪些相关变量应该作为配对的依据,且大部分统计技术都是用来评估随机化实验结果的,如果不这样设计,九无法使用这些统计方法进行评估。

缺点:只有受试者的数量比较大,概率抽样法则起作用时,随机化才有意义。

3、实验设计的变体

(1)前实验研究(经常为非专业研究使用)

1.单次研究设计——只有一组受试者,在接受实验刺激之后直接接受有关因变量的测量

2.单组前后测设计——实验组加上前测,但没有控制组

自变量以外的某些因素可能会引起前后测之间的变化,无法确定实验组的改变是由于自变量的改变而导致的。

3.静态组间比较——有实验组与控制组,但没有前测

除非时随机分派受试者,否则无法知道两组在实验前的状态是否相同

(2)实验研究中的效度问题

1.内在无效度——指的是从实验结论并没有准确反映实验本身的可能性。

在任何时候,只要实验以外的因素影响了因变量,九会造成内在无效度。列举: 历史事件:实验过程中发生的历史事件将把实验结果弄得混淆不清 成熟:无论是否参与实验,人们都在不断成长和改变

测验:如果试验中一测再测,也会影响人的行为,进而混淆实验结果

统计回归:由于受试者原先处于极端的位置,他们发生的变化会让人误判时实验刺

激的效果

实验死亡率:受试者的提前推出

实验处理中的传播与模仿:实验组与控制组如果相互沟通,使控制组受到“污染”

补偿:控制组的成员被认为是被剥夺了某种有价值的东西,参与实验的工作人员因

而可能会为他们提供某种补偿,如此以来,控制组就不在是真正的控制组了。

补偿性竞争:被剥夺了实验刺激的控制组成员可能通过更加努力的工作进行补偿。 自暴自弃:控制组觉得受到差别待遇,也肯能因此自暴自弃。 因果时序 选择偏好 测量工具

2.外在无效度——实验结果概化到“实验”世界的可能性。

“所罗门四组设计”,涉及四组受试者,从一群人中随机分派,用来处理实验本身与

刺激产生交互作用的一种方法。这种方法还可以提供资料比较古典实验进行中交互作用的大小。

1 刺激

Djkasina 第一组 前测 后测

2 刺激 3 第二组 前测 后测

第 三 组 刺激 后测 4 第 四 组 后测

所罗门四组设计 1.后测显示的偏见应比前测的少 2.后测与前测应显示同等的偏见

3.第一组显示的偏见应比第二组的少 4.第三组显示的偏见比第四组的少

“仅有后测的控制组设计”也就是由所罗门四组设计的后半部分组成。涂过真正做到随机分派,真正的实验只需要三四组就可以应付内在无效度问题以及实验与刺激的交互作用。这个设计与静态组间比较的区别就在于受试者被随机分派到实验组与控制组。

4、“自然”实验法

许多重要的社会科学实验通常发生在受控制的情境之外,发生在一般社会事件的进展之中。我们可以观察和分析自然设计并实施的实验,有时候是社会与政治决策者发挥此种自然的功能。

6、实验法 优劣

受控实验的主要优点在于把实验变量与它带来的影响分开,此外,由于实验有一定的范围限制,省时、省钱,只需要很少的受试者,可以经常用几个不同组的受试者重复做同一实验,如同所有其他形式的科学研究,研究结果的可重复性会让我们对其效度与概化更为深信不疑。它严密的逻辑性是其他观察方法难以比拟的。

最大的弱点在于认为造作。能在实验室中发生的未必能在较自然的社会环境里发生。

二、调查研究

1、适于调查研究的议题

(1)期望收集原始资料描述某个庞大以至于无法直接观察的群体 (2)测量群众态度与倾向性 (3)对社会现象的一般状态的描述

严谨的抽样能够提供具有代表性的样本,该样本成员的特征能够反应较大群体的特征,二严谨的标准化的结构性问卷,能保证从所有受访者那里获取相同形式的数据。 受访者——通过回答调查问卷来提供分析资料的个体。

问卷——其中包括了问题和其他类型的项目。他们用它来获取分析和分析相关的信息。问卷主要是在调查研究中使用,但同时也可以在实验、实地研究和其他观测方法中使用。

2、提问的原则

下面的几点对于设计结构化的问卷很有用,当然也可以用于在定性研究、深度访谈中更为开放的问卷,其基本的逻辑对于提问来说都是相当有价值的的。 (1)选择合适的问题形式

1.问题和陈述

陈述比较简短,典型的问卷中问题和陈述通常几乎一样多,可以在项目设计中更具灵活性,同时也能够让问卷更加吸引人。 2.开放式问题和封闭式问题

开放式问题——受访者被要求做出自己的回答的问题。深度访谈和定性访谈就是基本依

赖于开放式问题。

封闭式问题——受访者被要求在研究者所提供的答案中选择一个答案。因为封闭式问题

能够保证回答具有更高的一致性,并且比开放式问题更容易操作,因而在调查研究中相当流行。 封闭问卷的结构应该遵循两条结构要求:1.答案的分类应该穷尽所有的可能性;2.答案

的分类必须是互斥的。

3.问题要清楚(避免误解) 4.避免双重问题 5.受访者必须胜任回答 6.受访者必须愿意回答 7.问题应该中肯

当有些态度只有极少数的受访者会考虑或者真正在意时,那么测量结果就不太可能有用

8.问题越短越好

9.避免否定性问题(否定问题容易导致误解) 10.避免带有倾向性的问题

倾向性——倾向于将被测量的事物引向某特定方向的测量设备的特性。

3、问卷的建构 (1)一般的问卷格式

作为一般性的准则,问卷应该平展、整齐。不要将不止一个问题放在同一行,或者在第一页安排过多的问题。 (2)回答的格式

选用盒式选择,或者在每个回答旁边给出一个数字,让受访者圈上相应的数字。后者在以后的资料处理阶段时具有额外的优势,因为它指定了编码数字。

(3)关联问题——只针对部分受访者的问题,其是否需要回答取决于受访者对其他问题的回答 对问题的恰当使用,能够便利受访者对问卷的回答,因为这样他们就无需试着回答那些跟他们不相关的问题。 (4)矩阵问题

需要问几个具有相同答案分类的问题,尤其使用李克特答案分类时,可以建构一个矩阵式的问题和答案。

优点:1.有效地利用了空间 2.受访者能够更迅速地完成这种格式的问题 3.提高回答之间的可比性。

缺点:1.导致将同样的答案选项应用在一些并不太适合的问题上 2.强化一些受访者的回答模式(用同一个答案如“同意”来回答所有的陈述,当某组陈述是以几个具有相同倾向的问题开始,而且只有最后的几个问题才是以相反的倾向进行陈述时,尤其这样)

解决的方式:通过交叉放置代表了不同倾向的陈述,和尽量使得陈述简短、清楚。 (5)问题中的问题序列

1.一个问题的出现可能会影响到后面问题的回答。

2.受教育程度低的受访者比受教育程度高的受访者更容易受到问题序列的影响

3.随机序列的问题:随机的问题序列极有可能时混乱的、无用的,随机序列还使得问题不好回答,因为他们不得不经常转换他们的注意力。

最好的解决方法时对问题保持敏感,可以尝试着估测问题序列的影响,这样就可以有效地解释结构。如果问题序列相当重要,可以用多种不同的问题序列来建构多个版本的问卷,通过比较不同版本的问卷所收集的资料,就可以判断各个版本的效果。 (6)问卷说明

在合适的地方富有一个清楚的说明和介绍 (7)预调查

避免问题过于模糊,受访者无法回答,或是避免违背了问题设计的原则。还可以进行预编码 4、自填式问卷(三种主要的实施调查的方法之一) (1)邮寄问卷的分发和回收

(2)监控问卷的回收

回收问卷时,应该开始着手记录受访者回函的各种数据,其中,回函率的图解是相当宝贵的工具。作为工作的辅助工具,一般要收集两种图表:1.必须显示每一天的回函数量——增加或减少 2.必须记载累计的数量和百分比。

问卷被收回时,每一份问卷都应该打开,记上识别代号(一定要按序号编列,即使已经使用了其他的识别代号)

(3)补寄问卷

一个提高邮寄问卷回收率的有效方式,在恰当的时间进行问卷的追踪,只是给他们一个回复的额外刺激。三级邮件沟通是最有效的。

(4)可接受的回收率

回答率——参与调查的人数与样本总数之比,也称为完成率。在自行填答的问卷中也称返还率,即返还问卷占所发出的问卷的比例。

进行分析和撰写报告,问卷回收率至少要有50%才是足够的,至少达到60%才算是好的,达到70%就非常好。事实上,一个经过验证且没有偏误的回收问卷要比有偏误的高回收率重要得多。

5、访谈调查(三种主要的调查研究方式之一)

访谈——访谈者直接向受访者提问的资料收集方式。可以通过面对面的方式进行,也可以通过电话进行。

是收集调查资料的一种替代方式。典型的访问通常是以面对面的方式来进行 (1)访问员的角色

1.访问员收集问卷资料比受访者自行填答问卷回收率高得多 2.就问卷的内容,访员能够减少“我不知道”之类的回答

3.访员能对一些容易混淆的问卷项目提供相关的指导,访员可以对受访者误解的问题进行澄清,以获得相关的答案。

4.访员不但能问问题,还能观察受访者

对访员的要求:访员必须能配合上述情况,其表现不应该影响受访者的知觉及意见。

(2)访谈调查守则 1.外观与举止

一般规则是,访员的穿着应与受访对象风格相似。

在举止上,访员起码要表现得神情愉悦。必须要能传达一种诚恳到兴致来了解受访者,

必须保持轻松与友善到态度,但不能太随便或是太热情。优秀到访员应该能够在最短的时间内,判断出最让受访者感到舒服的态度和受访者最喜欢的谈话方式。 2.熟悉调查的问卷

访员应该仔细研读问卷,达到能够对受访者清晰无误地逐字逐句念出整份问卷。 访员必须熟悉为问卷设计的说明书。

3.谨遵问卷中的遣词造句 4.准确记录答案 5.深入追问受访者

追问——一种在访谈中会用到的技巧,以获得更为详尽的答案。通常是间接的词语或者

问题,可以鼓励受访者提供更详细的答案。

经常用于开放式问题。为研究分析提供充足的资料。

每当认为某问题需要追问以求得更确切的答案时,就应该在问卷中这个问题的后面,列

出一个或一个以上的追问形式,优点:将有更多的时间来设想更好且更中立的追问方式;无论何时需要,所有的访员将能使用同样的追问方式。

6.协调与控制

研究工作涉及不止一个访员时,要进行两方面的管理:训练访员和访问期间的督导。

6、电话访问

优点:金钱与时间,可以随意穿着,有时在受访者未能亲眼看见访员的情况下反而会更加诚实,也许这些答案时社会所不能认同的。可能让访员深入地追问更加敏感的问题,当然也有例外。

电脑辅助电话访问:除了在资料收集方面具有明显的优点外,还能自动地准备分析所需的资料。

7.新技术与访谈研究 (1)电脑辅助亲身访谈CAPI (2)电脑辅助自我访谈CASI

(3)电子化的自我填答问卷CSAQ:受访者通过软盘、电子公告牌或者其他方式获得问卷,运行相关程序,该程序能够提问并接收受访者的答案,受访者返还数据文档即可。

(4)按键输入资料TDE:受访者打电话到研究组织,一系列的电子化随之激活,受访者利用电话的按键来输入答案。 (5)声音确认VR (6)在线调查

核心:是要正确评估并给予不同的受访者不同的权重。 缺点:在线回答的人很难代表更有一般性的总体。

七、调查研究的优缺点

(1)自填式问卷与访谈调查法相比,优点在于经济、迅速、不因访员而产生差异,因为较具匿名性与非公开化,可促成受访者更诚实地回答敏感问题。

访谈调查对于自填式问卷的优势,在于前者少有回答不完整的问卷,也较少有误解问卷题目的情况,回收率也较高,自抽样和具体观察中,还有较大的弹性。

(2)电话调查相对于面对面的访谈的优点式省时省钱。前者的访谈员也比后者的访谈员更为安全,并且对访谈本身的影响较小。

(3)在线调查跟邮寄调查相比,具有跟多优势和劣势。在线调查比较便宜,但代表性较差。

(4)一般来说,调查研究法的优点在于经济和可以收集到大量的资料,而资料收集是的标准化过程,呈现了调查研究法另一个特别的长处。

调查研究的不足在于:受人为因素影响,并且有些肤浅、相对不够灵活。使用调查方法,很难对社会过程的自然状态有一个充分认识,一般来说,调查研究具有相对低的效度和相对高的信度。

八、二手分析

作为观察方式的一种,调查研究涉及步骤: 1.设计问卷结构 2.抽选样本

3.收集资料(通过访问或自填式问卷)

二手分析——指的是某人收集和加工的资料被另一人所用——经常是出于不同目的。尤其适合于调查资料,资料档案就是储存和分发二手分析的资料的仓库或图书馆。

二手分析为社会研究者提供了一种简便、便宜的“收集”资料的重要方法。但其效度可能不高。

三、定性的实地研究

定性的实地研究使得研究者能够中自然状态下观察社会生活:到行动发生的地点去看看。这种类型的研究比其他观察方法能够提供关于很多社会现象更丰富的理解,也使得研究者能够以一种深思熟虑的、周详计划的、主动的方式进行观察。

实地研究与其他观察方法的不同之处在于它不仅仅是资料收集,也是典型的理论生成活动。在实地研究中,观察、资料处理和分析是相互交织、循环的。 1、适于实地研究的议题

主要长处在于能够给研究者提供系统的观点,通过尽可能完全直接地观察与思考一种社会现象,也可以对其了解得比较深入和周全。

尤其适合那些难以定量化的、适合在自然情境下研究态度和行为,其中包括实践、情节、邂逅、角色、关系、群体、组织、聚落、社会世界、生活形态和亚文化。而实验和问卷则多在人为到情境下测量态度和行为。

特别适合跨越时间的社会过程研究。

2、定性的实地研究所要注意的特殊事项 (1)观察者的不同角色

在实地研究中,观察者可以扮演好几种角色,包括参与他们所要观察的活动。不同的情况要求研究者扮演不同的角色。 (2)和研究对象的关系

3、一些定性的实地研究范式

(1)自然主义——一种实地研究的方法,其假设存在客观的社会现实,而这些现实能够被正确观察和报告。

(2)常人方法学——着力于发现社会生活中隐含的、通常没有说出来的假设和共识的一种方法。这种方法通常使用打破共识这种方式来解释共识的存在。

自然主义实地研究者的目的是要理解参与者所理解的社会生活,而常人方法学者则试图找到达成理解的方法。

(3)草根理论(导论P141)——一种研究生活的归纳方法,试图通过比较观察来总结出理论。这跟假设检验很不一样,在后者,假设来自于理论,并接受观察的检验。可以被描述为在定性研究中,试图综合自然主义方法和实证主义,以达成“程序的系统化模式”的努力。

斯特劳斯等人为草根理论可以让研究者在保证科学性的同时具有创造性——只要研究这遵循以下准则:

1.时不时地进行反思 2.保持怀疑的态度

3.遵循研究程序:资料收集和分析的程序应该是相当严格的。这些程序能够帮助研究者摆脱倾向性,并且可以引导研究者检验那些可能会影响资料解读的假设。

草根理论关键的归纳式原则:在没有假设的情况下收集资料。最初的资料决定了所要观察的关键变量,而便利之间的关系的假设也同样来自于所收集的资料,不断持续的资料收集过程会影响研究者的理解,反过来,也使得资料收集得目的性更强。

(4)个案研究和扩展得个案方法

个案研究——对某社会现象得例子进行深度检验,比如一个村庄、一个家庭或者一个青少年帮派。

拓展得个案方法——波罗威所发展出来得一种个案研究方法,它是用来发现现有社会理论得缺陷并发展现有理论得。

波罗威将扩展得个案方法看作是重建、发展理论,而不是证明或者驳斥理论的方式,他寻找与既有理论相冲突的方式,这种研究取向意味着事先熟悉文献是很有必要的,但草根理论家担心知道了其他人的结论可能会给他们的观察和理论带来倾向性。

(5)制度民族志——一种利用个人经历来揭示个人活动于其中的权利关系和其他制度性特性的方法。

(6)参与行动研究——在这种社会研究中,研究对象对研究目的和程序具有一定的控制权;它反对那种人为研究者优于研究对象的假定。

在此范式中,研究者的功能是要对研究对象——特别是弱势群体——出谋划策,以帮助他们更好地实现自己的利益。在这种研究中,处于弱势的研究对象找出他们自己的问题和所渴求的结果,然后研究者就设计方案以帮助他们实现目的。这种方法强烈批评古典社会学研究。在他们看来,传统研究是一种“精英模式”,并将研究主体还原为研究的对象。应取消两者之间的差别。

4、实地研究操作

(1)实地研究的准备工作

包括背景研究、决定如何接触研究对象以及解决研究者和研究对象的关系问题。

(2)定性访谈——跟调查访谈相比,定性访谈的基础是一组进行深度访谈的主题,而不是标准化的问题。本质上由访问者确立对话的方向,再针对受访者提出的若干特殊议题加以追问。 1.提出议题:将访谈目的以及欲探讨的概念明确化 2.设计:列出达成目标需经历的过程,包括伦理方面的考虑 3.访谈:进行实地访谈

4.改写:建立关于访谈内容的文件

5.分析:确定收集到的资料与研究之间的联系 6.确证:检查资料的信度和效度 7.报告:告诉别人学到了什么

(3)专题小组——同时访谈一群人,并鼓励讨论。这种技术经常在市场调研中使用。它基于结构化的或半结构化的访谈。

优点:1.该技术是社会取向的研究方法,试图抓住社会环境中真实生活的资料 2.很有弹性

3.具有很高的表面效度 5.结果来得很快 5.成本低

6.引出研究者所没有想到的的一些内容 缺点:1.研究者的控制能力降低 2.资料难以分析 3.协调人员需要特殊技巧 4.小组间的差异也很麻烦

5.小组间总是存在差异 6.讨论必须在有益的环境下进行

(4)观察的记录 1.不要过分信赖记忆 2.分阶段笔记

3.原则上需要把能够回想起的细节都记录下来

5、实地研究的伦理

6、实地研究优缺点

优点:有深度,有弹性,花费相对较少,效度高

缺点:1.由于是定性而不是定量,很少能针对大型群体做出精确的统计陈述 2.信度低

四、非介入性研究

非介入性研究——一种在不影响研究对象的情况下研究社会行为的方法,可以是定量的也可以是定性的

1、内容分析法——对记载下来的人类传播媒介的研究,如书籍、网站、绘画和法律。 (1)适于内容分析法的议题

特别适用于传播媒介方面的研究,此外也被用于研究传播过程和社会行为的其他方面,并回答传播媒介研究的一个经典问题:“谁说了什么、对谁说、为什么说、如何说,以及产生什么影响”

(2)内容分析法的抽样

1.分析单位:传播的要素,例如字、段落和书籍,都是内容分析中有用的分析单位 2.抽样技术:标准的概率抽样技术适用于内容分析。

(3)内容分析法的编码

编码——将原始资料转变标准化的形式的过程。这样就可以利用机器来处理和分析这些资料。

内容分析法在本质上是一种编码运作,内容分析中的编码包含着概念化和操作化逻辑。 1.显性内容——于内容分析法相关的、传播媒介中包含的有形的词语,刚好区别于隐形内容。

隐性内容——于内容分析法相关的、传播媒介中所隐含的意义。 2.概念化和编码表的制作 3.计算和保持记录

如果要定量评估内容分析资料,在编码的时候就要留有余地: 首先,编码的最终结果必须是数字化的;

第二,在记录上清楚地说明分析单位于观察单位之间地区别十分必要,尤其在两者不相同的情况下;

第三,在计算过程中,记录计算的基础也非常重要 4.定性资料分析

(4)内容分析法的优缺点

优点:经济、安全、非介入性,能够研究一长段时间内发生的事件 缺点:局限于已经记录下来的问题,信度、效度也存在问题

2、既有统计资料分析法

可以提供历时的或概念性的文本,研究者可以根据这些文本进行研究定位;也可以作为社会科学调查的主要资料。

与既有统计资料分析有关联的效度问题通常可以用逻辑推理和复证方法来进行处理。现有统计资料通常有信度问题,使用它们时必须小心。

步骤:1.选择合适的资料 2.处理资料 3.说明资料来源

3、历史/比较分析法

历史/比较研究——研究社会(或者其他社会单位)的历时变化,并对不同的社会进行比较。发现不同文化中的历史模式。

通常被看成是一种定性方法,但它也可以利用定量技术。

五、评估研究

评估研究——就是要判断某社会干预——比如某项试图解决社会问题的措施——的结果。 1、适于评估研究的议题

社会干预——是指在一定的社会环境下,为了获得某些具体的结果而采取行动。

适合评估研究的实际上都是相当重要的问题:工作、项目、投资以及信仰和价值。

2、问题设计:测量问题

认真设计问题,包括相关的测量及成功或失败的标准,是评估研究的重要方面。 (1)说明结果

对于评估研究的测量而言,主要的变量就是结果变量或反应变量。 (2)测量实验环境 (3)辨明干预因素 (4)界定总体

(5)新的与已有的测量

在测量不同变量时,研究者要决定时设计新的测量标准还是使用他人曾用过的。现存测量方法可以节省时间、精力,经常被研究者使用的方法具有可比性,长期使用的测量方法通常有较好的信度和效度。

(6)操作化的成功/失败——可以通过比较不同的项目来确定

3、评估研究设计的类型 (1)实验设计 (2)准实验设计

准实验设计——一种有点类似于实验设计但又不是很严格的方法,它缺少实验设计中一些关键性的要素,比如前测、后测和/或控制组。

时间序列设计——该研究设计研究随时间而变动的过程,比如对降低限速标准前后的交通事故的研究。

缺点:1.无法判断所假设的变量是否对因变量有主要影响

2.测量态度和价值观的变化时很困难的,由于趋势研究是要不断地观测社会发展变化和新地社会现象,它很难利用现有地量表或标准问卷因此无法确定测量工具地效度。

非等同对照组——跟实验组相类似的控制组,但不是随机产生的。这种控制组在因变量或者跟因变量相关的变量上,与实验组有显著不同。

(3)多元时间序列设计——运用多套时间序列资料,进行比较分析的方法。 (4)定性评估

定量的和定性的资料分析都适用于评估研究,甚至同一研究中同时使用两种方法。

4、社会环境 (1)后勤问题

指称受试者做该做的事、接受和归还研究工具,以及其他似乎不具挑战性的工具 (2)伦理议题

(3)研究结果的应用

研究结果没有实施的原因:

1.研究结果并非总是用非研究者可以理解的方式表达出来 2.评估结果有时与宗教信仰相矛盾 3.既得利益事使用评估结果的障碍

5、社会指标研究

社会指标——反映社会生活的状态或质量的测量,比如犯罪率、婴儿死亡率等。它通常用来判断某一社会变革的性质。能够对广泛的社会过程提供解释。

有时电脑模拟模型可以用来指出社会干预可能产生的结果,而不需要在实际生活中去经历。

资料分析

一、定性资料分析

定性分析——对观察进行数字化的考察和解释的过程,其目的事要发现内在的意义和关系模式,尤其应用在实地研究和历史研究中。 1、理论与分析的联结 (1)发现模式

在分析资料的时候,最重要的事找出适用于多个不同的研究个案的解释模式: 1.变量导向分析——描述和/或解释特定变量的分析方法。

2.个案导向分析——试图通过探讨每个细节来理解某个或几个个案的分析方法。

3.跨个案分析——对多于一个的个案进行分析——可以是变量导向分析也可以是个案导向分析。

(2)草根理论方法(GTM)——一种归纳方法,理论只来自于资料而不是演绎。

这种方法从观察而不是假设入手,寻求发现模式并自上而下发展理论,其中没有任何预设。 持续比较法——草根理论的一个构成部分,就是说观察之间相互比较,并将观察和建构中的归纳理论进行比较。

包含了四个阶段(社会研究方法P364)

(3)符号学——对符号以及与符号相关的意义的研究。通常应用在内容分析中。

(4)谈话分析——对谈话细节的仔细分析,这种方法建立在详尽记录——包括休止符、感叹词、支吾声等——的基础上。

2、定性资料处理 (1)编码 1.编码单位 2.手工编码 3.建立编码

开放编码——在定性资料分析中,对概念的初始分类和标注。在开放编码中,编码是由

研究者对资料的检验和质问决定的。

(2)备忘录——即在定性研究中所做的记录,它是分析资料的一部分。既可以描述、界定概念,涉及方法论问题,或者提供初始的理论陈述。

在草根理论中,备忘录尤其重要:

1.编码记录:将编码标签及其意义对应起来。

2.理论记录:覆盖了很多主题,维度和概念的深层的反映,概念之间的关系,理论假设等等 3.操作记录:关注的主要是方法论问题,其中部分会关注资料收集环境,这对后面理解资料也有关系。

4.基础性备忘录:一旦有想法就可建立,无需特定理由和意义。

5.综合备忘录:将几个分类备忘录串联起来,并由此突现整个研究的内在逻辑。 (3)概念图——概念以及概念之间的关系的图表表示。在理论形成过程很有帮助。

3、定性资料的电脑处理(社会研究方法P373) 4、定性资料的定性分析

二、定量资料分析

定量分析——为了描述和解释观察所反映的现象而使用的数值表示和处理方法。 1、资料的定量化

所有的资料最初都是定性的,必须对其进行定量化以进行统计分析,定量化常常包括编码成用数值来表示的类别。 (1)设计编码类别

研究者可以使用既有的编码方案,如普查局关于职业的分类;或者设计他们自己的编码分类。编码方案必须适合于研究的特性和目标。 (2)建立编码簿

编码簿——资料处理和分析中所需的一个文档,它能够告诉研究者不同的资料在资料文档中的位置。一般用以识别资料的位置和用来代表不同变量属性的编码的意义。从中可以查到所需要的变量,包括每个变量中的属性号码。

功能:1.它是编码过程中的指南

2.分析的时候,告诉研究者每个变量在资料文档中的位置及每个号码所代表的意思。 注意:1.每一个变量,都是以原有变量的缩写形式来界定 2.每本编码簿必须对变量进行完整的定义 3.编码簿必须指出每种变量的属性 4.给每种属性都贴上一个数字标签 (3)数据登陆

除了将资料转化成定量形式之外,想进行定量分析的研究还需要将资料转化成机读格式,使得电脑能够读取并处理资料。

2、单变量分析——出于描述的目的,对单个变量进行分析。频次分布,平均值和离散趋势测量都是单变量分析,跟双变量分析和多变量分析形成对照。 (1)分布

频次分布——对一样本中变量的不同属性出现次数的描述。比如说,样本的53%是男性,47%是女性。另外一个例子可以是15个被研究的城市人口在1万以下;23个城市的人口在1万到2.5万之间等等。 (2)集中趋势

平均数(集中趋势)——代表集中趋势——典型性或常规性——的一个含糊术语。算术平均值,中位数和众数都是数学平均数的具体例子。

平均值——加总多个观察,除以观察单位总数所得到一个平均值。(定距变量) 众数——代表着最常出现的观察值或者属性。(适合定类变量)

中位数——在观察属性排列中位于“中间”的那个个案的值。(适合定序变量)

(3)离散趋势——围绕中心值——比如平均数——的值的分布。极差就是个简单例子。比如我们可以报告说平均年龄是37.9,范围从12岁到89岁。

标准差——对围绕平均值的离散趋势的测量。本质上,标准差是某套资料的变异程度的指标。高的标准差意味着资料比较离散,低的标准差意味着资料比较聚集。

(4)连续变量和离散变量

连续变量——其属性逐步、稳定增加的变量。 离散变量——其属性彼此隔离,或者说不连续的变量。

(5)细节可处理性——资料的完整与方便之间的矛盾

3、子群比较——以来描述子群之间子某些变量上的相似性和差异

4、双变量分析——为了决定两个变量之间的经验关系而同时对两个变量进行分析。探讨的是自变量和因变量之间的统计相关,其目的通常是解释而不是描述。 (1)百分比表格

(2)建立和解读双元表格

制作解释性双变量表格的步骤: 1.按照自变量的属性将样本分组

2.按照因变量的属性来描述这些分组好的子群体

3.按照因变量属性将自变量的子群相比较,以解读这个表格

列联表——用百分比分布来表示变量关系的格式,因变量必须依靠自变量值而定。 原则:1.表格必须要有表头或标题,以简洁地描述表中的内容。

2.变量原来的内容必须清楚说明——如果可能的话,可呈现在表格中,或者写在正文中,再加一段附于表中。当变量是取自于对态度问题的回答时,这个信息尤为重要,因为答案的意义主要取决于问题的问法。

3.每一个变量的属性必须清楚地说明。

4.当在表格中使用百分比时,必须说明计算标准。

5.若因缺失资料而必须将某些样本删除,其数量必须标于表格中。

5、多变量分析——对几个变量之间的关系的同时分析。

三、详析模式

详析模式——通过控制第三个变量的影响来理解两变量之间的关系的逻辑模式,其主要时拉扎斯菲尔德发展出来的。详析模式的多种结果时复证、辨明、阐明和标明。

详析模式是一种适用于社会研究的多变量分析方法,基本上是逻辑模型,它可以说明其他多变量方法的基本逻辑。详析模式是一种很好的逻辑工具用来对资料进行展开分析。

1.将样本按照检验变量(或者说控制变量——在进一步澄清其他两变量之间的关系时保持不变的变量。)分成几个子变量。

2.两个原始变量间的关系在两分样本中被分别重新计算。按照这种方式所建立的表格被称为净关系——详析模式中,控制两第三个变量的情况下,两个变量在子群中的相关关系,有时也称偏相关。

3.将这个净关系与在所有样本中发现的原有关系——也就是零阶关系(在详析模式中,也就是在不引入控制变量的情况下,两变量之间的初始关系),表示还没有控制其他变量时两变量之间的关系——进行比较。 1、详析范式

(1)复证——跟详析模式相关的一个术语,指的是引入变量之后,原有的两变量关系并没有改变。进一步加强了原关系为真的信心

(2)辨明——两变量之间的初始关系被证实是虚假的——因为引入控制变量后原关系消失了——这样一种详析模式结果。

必须具备条件:1.检验变量必须先导于自变量与因变量 2.净关系必须是零或明显小于原有关系

(3)阐明——跟详析模式相关联的一个术语。表示的研究结果是说控制变量是原初相关关系中的中间变量,也就是说,自变量通过影响控制变量和影响因变量。

(4)标明——详析模式中用到的一个技术术语,宝石的详析结果是说引入控制变量之后,两变量之间的初始关系在某些子群中继续存在,而在另外一些子群中则不复存在,这个时候,就要标明初始关系存在的条件:比如,存在于男性中,而不存在女性中。

(5)范式的调整

1.基本的范式假定两变量间有一个初始关系,在一个更复杂的模型中,区分正相关关系于负相关关系是很有用处的,单即使初始关系为零,也可运用详析模式。

抑制变量——在详析模式中,使得初始关系不能显现的检验变量。

2.基本模型的焦点在于净关系是否与原有关系相等或比其弱,但它没有提出任何指导原则,以辨明是什么构成了原有关系与净关系之间的显著差异。

3.基本范式局限于人为净关系等同或弱于原有关系,这就忽略了两种可能性:净关系可以比原有关系更强,或者,就根本与原有关系相反。

曲解变量——在详析模式中,颠倒零阶关系的方向的变量。

4.基本范式主要着重于二分式检验变量。实际上,详析模式并非局限于此——不论式理论上还是实用上——但如果检验变量将样本分成三个或更多个子样本,则基本范式会变得更复杂。此外,同时使用一个以上的检验变量时,范式也会变得复杂。

2、详析与事后假设

事后假设——在证实性的资料已经收集起来之后才提出的假设。由于不存在证伪的可能性,所以这种假设时没有意义的。

事后假设并不妨碍我们对任何观察到的关系进行推论;只是我们不能将这些推论弄成“假设”形式。更重要的是,一个已观察到的关系及其可能的推论,很可能引出有关其他变量间尚未被验证的关系假设。

四、社会统计(见统计研究运用)

1、描述统计——或者描述样本属性,或者描述样本中的变量关系的统计计算。其只是对样本观察的总结,而推论统计则超越特定的描述而对样本所代表的总体性进行推论。 (1)资料简化 (2)相关性测量

消减误差比例(PRE)——评估关系强度的一个逻辑模型,其原理是知道了一个变量的值之后,再去猜测另一变量的值所能减少的误差。

2、回归分析——用等式(也称作回归方程式)的形式来表示变量之间关系的一种资料分析方法 (1)线性回归——一种统计分析模型,它寻求能够最佳描述两个定比变量之间关系的直线模式。 (2)多元回归分析——这种统计分析模型寻求代表了两个或更多的自变量对单个因变量影响等式 (3)偏回归——在这种回归分析中,某个或者多个变量的作用被控制住了。跟详析模式很像。 (4)曲线回归分析——在曲线回归分析中,利用曲线而不是直线来表达变量之间的关系。 (5)回归分析注意事项

用回归分析作统计推论根据的是相关分析中使用的相同假设:简单随机抽样、抽样误差的存在以及连续性的定距资料。

回归线对内推(估算介于观察到到样本之间的值)很有用,但对外推的使用上却不太可靠。在外推上有两个重要的限制:1.可能会碰到那种看似不合逻辑推论的的回归方程。2.如果研究者超越了这个限制而进行外推,就可以据此批评他们。

3、其他多变量方法

(1)路径分析——一种用图表格式来表达变量之间的因果关系的多变量分析模型。 (2)时间序列分析——对一历史变量的分析。

(3)因素分析——用来判断存在于一组具体观察内部的因素或者一般维度的复杂的代数方法。

标准:1.该因素必须能够解释变量的绝大部分变异 2.每个因素彼此间多少应该互相独立。 优点:1.是找出大量变量间关系模式的有效方法 2.可以将资料以读者或研究者可判读的形式表达

缺点:1.因素的产生并没有任何实际意义。研究者常会发现一组实质上相去甚远的变量却在同一因素上有很高的荷载量。

2.从哲学的立场看,因素分析也常被批判。一个假设必须是可以被推翻的,如果一个研究者无法确立假设可能被推翻的情况是什么,那么该假设实际上不是自我重复就是毫无用处

4、统计推论——即从样本观察的发现推论到总体的统计方法。 (1)单变量推理(社会研究方法P450)

必须注意几个假设:1.样本必须来自需要推理的总体。从一本电话号码中抽出的样本,并不能正当地作为一个城市人口的推理基础。

2.推论统计假定样本由简单随机抽样得到,但实际上,在抽样调查中不可能做到这一点 3.推论统计只针对抽样误差,而不考虑非抽样误差——即来自抽样误差之外的资料质量的瑕疵。其中包括受访者对问题的误解、访谈者的错误记录、编码和打孔错误等。

(2)统计显著性——指的是样本中所观察到到关系能够归因于抽样误差的可能性。

统计显著性检验——该类统计计算揭示的是样本所观察到到关系能够归因于抽样误差的可能性。

(3)统计显著性的逻辑

显著水平——在统计显著性检验中,观察到的经验关系能够归因于抽样误差的可能性。如果其出于抽样误差的可能性不超过5%,那么就可以说在.05水平上该关系是显著的。

(4)卡方

在社会科学界经常用来检验显著性,根据是虚无假设(或零假设):假设在总体中者两变量间无任何关系。有了两个变量观察值的分布,我们可以计算出如果两变量没关系时的期望值的共同分布,这样的结果在列联表中被称为“期望频次”,然后将这些期望频次分布与实际从样本中得到的频次进行比较,接着确定两者之间的差异完全因为抽样误差的概率由多少。

计算方法:在表中的每一格1.用观察值减去期望频次 2.将上一步所得的值平方 3.用平方后的值除以期望频次。这些步骤在表中每一格都要做,然后将每一格所得之结果全部加总,最后的加总值就是卡方。

这个值表示样本观察值的联合分布与当两个变量不相关时的预期值之间的总差异。当然,仅发现差异无法证明两变量间的相关性,因为常态抽样误差也会造成差异,即使整个总体的变量间没有关系也使如此。然而,卡方值的大小却可以让我们估算相关性发生的概率。

1.自由度

2.注意事项

首先,我们时检验“统计显著性”,并没有检验客观的显著性。

其次,不应该计算从总体资料中观察到的抽样假设与计算置信区间的相同。

3.显著性检验的误导:

(1)显著性检验让实际抽样设计根本无法满足抽样假设

(2)显著性检验所依据的是没有非抽样误差的假设,这在大多数实际的实证测量中是相当令人质疑的

(3)事实上,显著性检验经常被用于测量相关性。而相关测量却又是在违反那些假设的情况下计算出来的

(4)统计显著性经常被误解为“相关强度”或实质显著性,后者指观察到的相关性很强、很重要、很有意义。