3.测量法则——操作规则
4.数字和符号—表示测量结果 三、社会现象的测量
与对自然现象的测量有很大差别:
(1)人的主客体矛盾。既是测量主体,又是测量客体。 (2)测量的内容常常是人的行为及行为构成的现象,而人的测量本身也是一种行为和现象,二者相互影响,导致测不准。
(3)测量的量化程度、精确化程度、可重复性比自然现象的测量差。 四、测量层次
1.定类测量
类别测量或定名测量。即将调查对象的不同属性或特征加以区分,标以不同的名称或符号,以确定其
类别。
具有两种属性:对称性和传递性。 数学特征:属于或不属于 2.定序测量
也叫等级测量或顺序测量。定序测量的取值可以按照某种逻辑顺序将调查对象排列出高低或大小,确
定其等级及次序。
数学特征:大于或小于 3.定距测量
也叫间距测量或区间测量。不仅可以区分类别、等级,还可以确定它们之间的间隔距离和数量差别。 数学特征:加、减 4.定比测量
也叫等比测量或比例测量。除了具有上述三种层次测量的全部性质外,还具有一个绝对的0点(有实
际意义的0点)。
数学特征:加、减;乘、除
●以上四种尺度层次由低到高,高层次的尺度具有低层次尺度的所有功能
第二节 指数与量表
一、指数和量表的概念 1.指数(index):由多个不同的回答所构成的一个简单累加的分数。
2.量表(scale):是一种具有结构强度顺序的复合测量,即全部陈述和项目都是按一定的结构顺序来安排,以反映出所测量的概念或态度具有的各种不同的程度。 二、李克特量表
三、鲍格达斯社会距离量表 四、语义差异量表
第三节 概念的操作化
一、注意区分以下三个概念:
概念:是对现象的抽象,是一类事物的属性在人们主观上的反映。 变量:包括若干个范畴、值或亚概念的概念。
指标:表示一个概念或变量含义的一组可观察到的事物,称为这一概念或变量的一组指标。 二、操作化的含义与作用
将抽象的概念转化为可观察的具体指标的过程。 三、操作化的方法
1.概念澄清与界定 2.发展测量指标
(1)列出概念的维度(2)建立测量指标
四、指标选择的多样性
对同一个概念进行测量时,可能会产生出不同的测量指标。 操作化举例:
例2 “父母投资”。
陈皆明博士在有关父母投资与子女赡养关系的研究中,将“父母投资”定义为“父母为子女所做的各种帮助”,并操作化为“早期家庭帮助”、“较近期的帮助”和目前“正在给予的帮助”三个大的方面以及一系列具体的指标。
例3 “溺爱孩子”。
风笑天在研究独生子女的教育问题时,需要了解和比较独生子女父母与非独生子女父母在溺爱孩子方面的行为表现和心理状态。研究中,他对“溺爱孩子”的概念进行了如下的操作化处理:
首先,根据“溺爱孩子”概念的名义定义,将其操作化为四个不同的维度,以反映这一概念的四个不同层面。这四个维度是:
(1)不注意培养孩子的生活自理能力;(2)不注意培养孩子的劳动习惯;(3)对孩子过分迁就; (4)物质上对孩子尽量满足。
然后,在每个维度上选择若干个具体指标。比如,第一个维度所选择的指标有是否自己洗头、洗澡、穿衣、收拾书包、整理床铺、自己上下学。第二个维度所选择的指标有在家是否抹桌、扫地、洗碗、洗手绢、上街买东西等。”
第四节 测量的信度与效度 一、信度(reliability)
即可靠性,用同样的测量方法对同一对象重复测量所得结果相一致的程度 1.再测信度 2.复本信度 3.折半信度 二、 效度(validity)
测量工具能够准确、真实度量事物属性的程度 1.表面效度 2.准则效度
3.建构(构造)效度 三、信度和效度的关系
相互联系,又相互制约
第六章 抽 样
第一节 抽样的意义和作用 一、抽样涉及到的几个概念
1、总体(N):总体是构成它的所有元素的集合。 2、样本(n):就是从总体小按一定方式抽取出的—部分元素的集合。 3、抽样(过程):指的是从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即
抽取总体的一个子集)的过程,或者说.抽样是从总体中按一定方式选择成抽取样本的过程。 4、抽样单位:就是一次直接的抽样所使用的基本单位。 (注意与构成总体的元素相区别)
5、抽样框(名单):又称做抽样范围,它指的是一次直接抽样时总体中所有抽样单位的名单。 6、参数值(总体值):也称为总体值,它是关于总体中某一变量的综合描述,或者说是总体个所有元素的某种特征的综合数量表现。
7、统计值(样本值):也称为样本值,它是关于样本中某一变量的综合描述,或者说是样本中所有元素
的某种特征的综合数量表现。 二、抽样的作用
社会现象十分复杂和多变的,而研究所能利用的时间、经费和人力又是有限的。 民意测验的神奇预测效果 三、抽样的类型
从大的角度可以分为两类:
概率抽样:依据概率论的基本原理,按照等概率原则进行抽样。可以避免抽样的人为误差,保证样本的代表性。
非概率抽样:依据研究者的主观意愿、判断和是否方便来抽样。
第二节 概率抽样的原理与程序 一、概率抽样的基本原理
社会群体的同质性和异质性——概率样本所反映的正是总体本身所具有的那种内在的异质性。 各种随机事件的背后,存在着事件发生的客观概率,而正是这种概率决定着随机事件的发展变化规律。——概率抽样就是按照总体中蕴涵的随机事件构成样本,因此能够很好地代表总体。 二、抽样分布
抽样分布是根据概率的原则而成立的理性分布,它显示出:从一个总体中不断抽取样本时.各种可能出现
的样本统计值的分布情况。 三、概率抽样的一般程序
1、界定总体
要使抽出的样本具有代表性,这是非常重要的一步。 2、制定抽样框
就是按照已经界定好的总体,编制一份总体中所有抽样单位的名单,并统一编号,以供抽样使用。 注意保证:无重复、无遗漏。
方法:使用已有的、自己编制。 3、决定抽样方案
决定具体采用哪种抽样方法,及抽取样本的数量、步骤等。 4、实际抽取样本 两种做法:
a、抽好以后再去调查 b、一边抽样一边做调查
5、评估样本质量
样本评估:就是对所抽取的样本的质量、代表性、偏差等进行初步的检验和衡量,防止过大误差。
方法:把样本的某些特征与总体的同类特征相比,差别越小,代表性越好。
第三节 概率抽样方法 一、简单随机抽样
等概率原则
常用方法:抽签、乱数表(随机数表) 二、系统抽样(等距抽样)
程序:编号 计算间隔 抽取起始号 抽取样本 K(抽样间隔)=N(总体规模)/n(样本规模) 注意:抽样框必须随机排列 常见的两种问题:
抽样框的排列有先后、等级上的次序;
抽样框的元素排列与抽样间隔相对应有周期性分布。 另一种方法:标尺法(但不太精确) 三、分层抽样(类型抽样)
优点:在不增加样本规模的前提下降低抽样误差,提高抽样的精度;便于了解总体内不同层次的情况,便于对不同类别单独或比较研究。 四、整群抽样
抽样单位是元素的集合,而不是元素。尤其适用于名单很难获得时。 优点:简化抽样过程、降低费用
缺点:样本分布面不广,对总体的代表性差 注意:与分层抽样的区别。
群内同质性强,群间异质性强; 群内异质性强,群间同质性强。
五、多段抽样
每个阶段的抽样单位不一样。每一阶段都可选用以上任何一种概率抽样方法。 优点:简便易行 缺点:误差较大
注意:在每一级抽样时保持适当比例 六、PPS抽样(概率比例抽样法)
解决的是每一阶段抽样时,各抽样单位规模不一致从而带来每一元素被抽中的概率不一等的情况。 举例:某市共有100家企业,共有20万名职工,需要抽取1000名职工作为样本。
方法:假如采用多阶段抽样,先从100家企业中随机抽取20家,再从这20家企业分别抽取50名职工,构成了样本。
如果这些企业规模不一,如最大的企业有16000名职工,最小的企业有200名职工,按照上述方法抽样,计算一下每名职工被抽中的概率是多少?
具体做法:通过两个阶段的不等概率,使每个元素被抽中的概率保持一致。
每个元素被抽中的概率=所抽取的群的数量*(群的规模/总体的规模)*(平均每个群中所要抽取的元素/群的规
模)
计算例一第一种方法里面居民户被抽中的概率。(假定居委会中最大的甲居委会有800户,最小的乙居委会有200户。)
PPS抽样实例
某市有23个区共714万人,欲从中抽取1000人的样本。
首先将区作为初级抽样单位,每区人数不等,将每区人数的号码范围列出,东区是1-120000,西区是120000-290000,南区是……一直排列到7140000,如表:
从这714个号码中用随机数表确定10个号码,则这10个号码所落入的区就是调查区。例如抽中340000号,则南区就为调查区。
再从这10个区中,每区随机选择100人就构成最终样本。
通过计算可以看出无论是元素多的还是少的区,每个区的每个元素最终被抽中的概率是一样的。
每个居民被抽中的概率
=(该区人数/总人数×所要抽取的区的数目)×(每个区所要抽取人数/该区人数) = 该区被抽中的概率×该居民家被抽中的概率
东区张三被抽中的概率=
(12万/714万×10)×(100/12万) =1000/714万
西区李四被抽中的概率=
(17万/714万×10)×(100/17万) =1000/714万
七、户内抽样
两种方法:
(1)kish选择法
编号排列—找到对应kish表——对号入座—抽中访问对象 (2)生日法
第四节 非概率抽样方法 一、偶遇抽样
(方便抽样/自然抽样) 二、判断抽样
(立意抽样)
三、定额抽样(配额抽样)
注意定额抽样与分层抽样的区别 四、雪球抽样
第六节 样本规模与抽样误差 一、样本规模(样本容量) 指样本中所含个案的多少.
统计学上的大样本和小样本以30个个案为界.但对社会现象的调查,30个个案远远不够. 关于置信度和置信区间:
置信度/置信水平:总体参数值落在样本统计值某一区间的概率,或者说是总体参数值落在样本统计值某一区间的把握性程度。
置信区间:指的是在一定的置信度下,样本值与参数值之间的误差范围。
二、影响样本规模确定的因素
1、总体的规模 2、抽样的准确性 3、总体的异质性程度
4、研究者所拥有的经费、人力、时间 三 、常见的样本规模 四、样本规模与抽样误差
抽样误差:是样本的统计值与总体的参数值之间的误差。
是由于抽样本身的随机性引起的。无论采取什么方法抽样,都不可避免。