高中数学第三章统计案例-3.1独立性检验卡方检验素材

?(一) 掌握内容 1. ?2检验的用途。 2. 四格表的?2检验。

2检验

(1) 四格表?2检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的?2检验。 3. 行?列表的?2检验。 (二) 熟悉内容

频数分布拟合优度的?2检验。 (三) 了解内容 1.?2分布的图形。

2.四格表的确切概率法。

(一) ?2检验的用途

?2检验(Chi-square test)用途较广,主要用途如下:

1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) ?2检验的基本思想

1.?2检验的基本思想是以?2值的大小来反映理论频数与实际频数的吻合程度。在零假设H0(比如H0:?1??2)成立的条件下,实际频数与理论频数相差不应该很大,即?2值不应该很大,若实际计算出的?2值较大,超过了设定的检验水准所对应的界值,则有理由怀疑H0的真实性,从而拒绝H0,接受H1(比如H1:?1??2)。 ,A为实际频数(Actual Frequency),T为理论频数

T(Theoretical Frequency)。四格表?2检验的专用公式正是由此公式推导出来的,用专用公

2. 基本公式:??式与用基本公式计算出的?2值是一致的。

(三)率的抽样误差与可信区间 1.率的抽样误差与标准误

样本率与总体率之间存在抽样误差,其度量方法:

2??A?T?2?p?Sp??(1??)n,?为总体率,或 (8-1)

p(1?p), p为样本率; (8-2) n2.总体率的可信区间

当n足够大,且p和1-p均不太小,p的抽样分布逼近正态分布。 总体率的可信区间:(p?u?/2?Sp,p?u?/2?Sp)。 (8-3) (四)?2检验的基本计算

见表8-1。

表8-1 ?2检验的用途、假设的设立及基本计算公式

资料形式 四格表

用途 ①独立资料两 样本率的比较

②配对资料两 样本率的比较

H0、H1的设立与计算公式

H0:两总体率相等 H1:两总体率不等

自由度 1

①专用公式

(ad?bc)2n ??(a?b)(c?d)(a?c)(b?d)②当n?40但1?T<5时,校正公式

2(ad?bc?n/2)n2 ??(a?b)(c?d)(a?c)(b?d)2③配对设计??R?C表

①多个样本率、 构成比的比较

②两个变量之 间关联性分析 频数分布的拟合优度检验

2(b?c?1)2b?c

(R-1)(C-1)

H0:多个总体率(构成比)相等

(H0:两种属性间存在关联)

H1:多个总体率(构成比)不全相等 (H0:两种属性间存在关联)

?2?n(?A2?1) nRnC频数分布表

H0:资料服从某已知的理论分布 H1:资料不服从某已知的理论分布

(A?T)2?T

据频数表

的组数而定

(五)四格表的确切概率法

当四格表有理论数小于1或n<40时,宜用四格表的确切概率法。

2?(六)检验的应用条件及注意事项

2?1.分析四格表资料时,应注意连续性校正的问题,当140时,用连续性校正

检验;T?1,或n?40时,用Fisher精确概率法。

2.对于R?C表资料应注意以下两点:

(1)理论频数不宜太小,一般要求:理论频数<5的格子数不应超过全部格子的1/5; (2)注意考察是否有有序变量存在。对于单向有序R?C表资料,当指标分组变量是有序的时,宜用秩和检验;对于双向有序且属性不同的R?C表资料,若希望弄清两有序变量之间是否存在线性相关关系或存在线性变化趋势,应选用定性资料的相关分析或线性趋势检验;对于双向有序且属性相同的R?C表资料,为考察两种方法检测的一致性,应选用Kappa检验。

典型试题分析

(一)单项选择题

1.下列哪项检验不适用?2检验( )

A. 两样本均数的比较 B. 两样本率的比较

C. 多个样本构成比的比较 D. 拟合优度检验 答案:A

[评析] 本题考点:?2检验的主要用途。?2检验不能用于均数差别的比较。 2.分析四格表时,通常在什么情况下需用Fisher精确概率法( )

A.140 B.T<5 C.T?1或n?40 D.T?1或n?100 答案: C

[评析] 本题考点:对于四格表,当T?1或n?40时,不宜用?2检验,应用Fisher精确概率法。

3.?2值的取值范围为

A.??

答案: B

[评析]根据?2分布的图形或?2的基本公式可以判断?2值一定是大于等于零且没有上界的,故应选B。

(二)是非题 两样本率的比较可以采用?2检验,也可以采用双侧u检验。 答案:正确。

[评析]就两个样本率的比较而言,双侧u检验与?2检验是等价的。 (三)简答题

1.四格表的?2检验和u检验有何联系与区别?

答案:相同点:凡是能用u检验进行的两个率比较检验的资料,都可用?2检验,两者是等价的,即u2??2;相异点:(1)u检验可进行单侧检验;(2)满足四格表u检验的资料,计算两个率之差的可信区间,可从专业上判断两率之差有无实际意义;(3)?2检验可用于2?2列联表资料有无关联的检验。

2.R?C表?2检验的适用条件及当条件不满足时可以考虑的处理方法是什么? 答案:R?C表?2检验的适用条件是理论频数不宜过小,否则有可能产生偏性。当条件不满足时有三种处理方法:①增大样本例数使理论频数变大;②删去理论数太小的行或列;③将理论数太小的行或列与性质相近的邻行或邻列合并,使重新计算的理论频数变大。但②、③法都可能会损失信息或损害样本的随机性,因此应慎用。

(四)计算题

1.为研究静脉曲张是否与肥胖有关,观察122对同胞兄弟,每对同胞兄弟中有一个属肥胖,另一个属正常体重,记录得静脉曲张发生情况见表8-2,试分析之。

表8-2 122对同胞兄弟静脉曲张发生情况

肥胖

发生 未发生 19 5 12 86 31 91

正常体重 发 生

未发生 合 计

合计 24 98 122

[评析]这是一个配对设计的资料,因此用配对?2检验公式计算。 H0:肥胖者与正常体重者的静脉曲张发生情况无差别 H1:肥胖者与正常体重者的静脉曲张发生情况不同 ??0.05 ?2?(b?c?1)2b?c=

?5?12?1?25?12?2.12,??1

2?2=2.110.05,尚不能认为静脉曲张与肥胖有关。

2.某卫生防疫站在中小学观察三种矫正近视眼措施的效果,近期疗效数据见表8-3。试对这三种措施的疗效作出评价。

矫治方法 夏天无眼药水 新医疗法 眼保健操 合计

表8-3 三种措施的近期有效率比较 有效人数 无效人数 合计

51 84 135 6 26 32 5 13 18 62 123 185

有效率(%)

37.78 18.75 27.78 33.51

[评析]

H0:三种措施有效率相等

H1:三种措施有效率不相等或不全相等 ??0.05

A2??n(??1)=185?

nrnc222222?512?84626513???????1?=?62?135123?13562?32123?3262?18123?18???4.498,?=(2-1)(3-1)=2

查表得0.25>P>0.10,按??0.05水准不拒绝H0,尚不能认为三种措施有效率有差别。 3.某医院以400例自愿接受妇科门诊手术的未产妇为观察对象,将其分为4组,每组100例,分别给予不同的镇痛处理,观察的镇痛效果见表8-4,问4种镇痛方法的效果有无差异?

表8-4 4种镇痛方法的效果比较 镇痛方法 例数 有效率(%) 颈麻 100 41 注药 100 94 置栓 100 89 对照 100 27 [评析] 为了应用?检验,首先应计算出有效和无效的实际频数,列出计算表,见表8-5。

表8-5 4种镇痛方法的效果比较

镇痛方法 有效例数 无效例数 合计 颈麻 41 59 100 注药 94 6 100 置栓 89 11 100 对照 27 73 100 合计 251 149 400

H0:4种镇痛方法的效果相同 H1:4种镇痛方法的效果不全相同

2??0.05

?412?A2592732???...??1?=146.175, ??n(??1)=400??149?100?nrnc?251?100149?100?2(2-1)=3 ?=(4-1)

查表得P <0.05,按??0.05水准拒绝H0,接受H1,即4种镇痛方法的效果不全相同。

四、习 题

(一) 单项选择题

联系客服:779662525#qq.com(#替换为@)