指标应使用
A.全距 B.标准差 C.变异系数 D.方差 E.四分位数间距 答案:A E D B E 二、计算与分析
1. 下表为10例垂体催乳素微腺瘤的病人手术前后的血催乳素浓度,试说明用何种指标比较手术前后数据的变异情况较为合适。
表 手术前后患者血催乳素浓度(ng/ml) 例号 血催乳素浓度 术前 术后 1 276 41 2 880 110
3 1600 280 4 324 61 5 398 105 6 266 43 7 500 25
8 1760 300 9 500 215 10 220 92 [参考答案]
血催乳素浓度术前均值=672.4 ng/ml,术后均值=127.2 ng/ml。手术前后两组均值相差较大,故选择变异系数作为比较手术前后数据变异情况比较合适。 术前: ,
术后: ,
可以看出:以标准差作为比较两组变异情况的指标,易夸大手术前血催乳素浓度的变异。 2. 某地144例30~45岁正常成年男子的血清总胆固醇测量值近似服从均数为
4.95mmol/L,标准差为0.85mmol/L的正态分布。①试估计该地30~45岁成年男子血清总胆固醇的95%参考值范围;②血清总胆固醇大于5.72mmol/L的正常成年男子约占其总体的百分之多少? [参考答案]
①正常成年男子的血清总胆固醇测量值近似服从正态分布,故可按正态分布法处理。又因血清总胆固醇测量值过高或过低均属异常,所以应计算双侧参考值范围。 下限: (mol/L) 上限: (mmol/L)
即该地区成年男子血清总胆固醇测量值的95%参考值范围为3.28 mmol/L~6.62 mmol/L。 ②该地正常成年男子的血清总胆固醇测量值近似服从均数为4.95mmol/L,标准差为0.85mmol/L的正态分布,计算5.72mmol/L对应的标准正态分布 值:
问题转化为求 值大于0.91的概率。由于标准正态分布具有对称性,所以 值大于0.91的概率与 值小于-0.91的概率相同。查附表1得, ,所以说血清总胆固醇大于5.72mmol/L
的正常成年男子约占其总体的18.14%。
3. 某地200例正常成人血铅含量的频数分布如下表。 (1)简述该资料的分布特征。
(2)若资料近似呈对数正态分布,试分别用百分位数法和正态分布法估计该地正常成人血铅值的95%参考值范围。
表 某地200例正常成人血铅含量(μmol/L)的频数分布 血铅含量 频 数 累积频数 0.00~ 7 7 0.24~ 49 56 0.48~ 45 101 0.72~ 32 133 0.96~ 28 161 1.20~ 13 174 1.44~ 14 188 1.68~ 4 192 1.92~ 4 196 2.16~ 1 197 2.40~ 2 199
2.64~ 1 200 [参考答案]
(1)从表可以看出,血铅含量较低组段的频数明显高于较高组段,分布不对称。同正态分布相比,其分布高峰向血铅含量较低方向偏移,长尾向血铅含量较高组段延伸,数据为正偏态分布。
某地200例正常成人血铅含量(μmol/L)的频数分布 血铅含量 组中值 频 数 累积频数 累积频率 0.00~ 0.12 7 7 3.5 0.24~ 0.36 49 56 28.0 0.48~ 0.60 45 101 50.5 0.72~ 0.84 32 133 66.5 0.96~ 1.08 28 161 80.5 1.20~ 1.32 13 174 87.0 1.44~ 1.56 14 188 94.0 1.68~ 1.80 4 192 96.0 1.92~ 2.04 4 196 98.0 2.16~ 2.28 1 197 98.5 2.40~ 2.52 2 199 99.5 2.64~ 2.76 1 200 100
(2)因为正常人血铅含量越低越好,所以应计算单侧95%参考值范围。
百分位数法:第95%百分位数位于1.68~组段,组距为0.24,频数为4,该组段以前的累积频数为188,故
即该地正常成人血铅值的95%参考值范围为小于1.80 。
正态分布法:将组中值进行log变换,根据题中表格,得到均值和标准差计算表。 某地200例正常成人血铅含量( )均值和标准差计算表
血铅含量 组中值 ( ) 频 数( )
0.00~ 0.12 -0.92 7 -6.44 5.9248 0.24~ 0.36 -0.44 49 -21.56 9.4864 0.48~ 0.60 -0.22 45 -9.9 2.178 0.72~ 0.84 -0.08 32 -2.56 0.2048 0.96~ 1.08 0.03 28 0.84 0.0252 1.20~ 1.32 0.12 13 1.56 0.1872 1.44~ 1.56 0.19 14 2.66 0.5054 1.68~ 1.80 0.26 4 1.04 0.2704 1.92~ 2.04 0.31 4 1.24 0.3844 2.16~ 2.28 0.36 1 0.36 0.1296 2.40~ 2.52 0.40 2 0.80 0.3200
2.64~ 2.76 0.44 1 0.44 0.1936 合计 — — 200 -31.52 19.8098 计算均值和标准差:
单侧95%参考值范围:
即该地正常成人血铅值的95%参考值范围为小于1.96 ,与百分位数法相比两者相差不大。 (李 康) 第四章 抽样误差与假设检验 练习题
一、单项选择题
1. 样本均数的标准误越小说明
A. 观察个体的变异越小 B. 观察个体的变异越大
C. 抽样误差越大 D. 由样本均数估计总体均数的可靠性越小 E. 由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是
A. 样本不是随机抽取 B. 测量不准确 C. 资料不是正态分布 D. 个体差异 E. 统计指标选择不当
3. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为 A. 正偏态分布 B. 负偏态分布 C. 正态分布 D. t分布 E. 标准正态分布 4. 假设检验的目的是
A. 检验参数估计的准确度 B. 检验样本统计量是否不同 C. 检验样本统计量与总体参数是否不同 D. 检验总体参数是否不同 E. 检验样本的P值是否为小概率
5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~9.1×109/L,其含义是
A. 估计总体中有95%的观察值在此范围内 B. 总体均数在该区间的概率为95% C. 样本中有95%的观察值在此范围内 D. 该区间包含样本均数的可能性为95% E. 该区间包含总体均数的可能性为95% 答案:E D C D E 二、计算与分析
1. 为了解某地区小学生血红蛋白含量的平均水平,现随机抽取该地小学生450人,算得其血红蛋白平均数为101.4g/L,标准差为1.5g/L,试计算该地小学生血红蛋白平均数的95%可信区间。 [参考答案]
样本含量为450,属于大样本,可采用正态近似的方法计算可信区间。 , , , 95%可信区间为 下限: (g/L) 上限: (g/L)
即该地成年男子红细胞总体均数的95%可信区间为101.26g/L~101.54g/L。
2. 研究高胆固醇是否有家庭聚集性,已知正常儿童的总胆固醇平均水平是175mg/dl,现测得100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平为207.5mg/dl,标准差为30mg/dl。问题:
①如何衡量这100名儿童总胆固醇样本平均数的抽样误差? ②估计100名儿童的胆固醇平均水平的95%可信区间;
③根据可信区间判断高胆固醇是否有家庭聚集性,并说明理由。 [参考答案]
① 均数的标准误可以用来衡量样本均数的抽样误差大小,即 mg/dl,
② 样本含量为100,属于大样本,可采用正态近似的方法计算可信区间。 , , , ,则95%可信区间为
下限: (mg/dl) 上限: (mg/dl)
故该地100名儿童的胆固醇平均水平的95%可信区间为201.62mg/dl~213.38mg/dl。 ③因为100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平的95%可信区间的下限高于正常儿童的总胆固醇平均水平175mg/dl,提示患心脏病且胆固醇高的父辈,其子代胆固醇水平较高,即高胆固醇具有一定的家庭聚集性。
(李 康) 第五章 t检验 练 习 题
一、单项选择题
1. 两样本均数比较,检验结果 说明
A. 两总体均数的差别较小 B. 两总体均数的差别较大
C. 支持两总体无差别的结论 D. 不支持两总体有差别的结论