医学统计学习题集
上海中医药大学预防医学教研室
1
医学统计学绪论习题
一、名词解释
1.同质和变异 2.总体和样本 3.抽样误差和误差 4.概率和频率
5.计量资料、计数资料和等级资料
二、最佳选择题
1.统计工作的前提与基础是:
A.设计 B.收集资料 C.整理资料 D.校对资料 E.分析资料 2.统计工作四个基本步骤是:
A.设计,收集资料、整理资料和分析资料 B.收集日常生活资料,报告卡片,分析资料,总结 C.收集统计报表,日常医疗工作资料,分析资料,描述资料 D.收集专门内容报告卡片,进行整理,分析资料,核对资料 E.收集病历,日常医疗工作资料,分析资料,归组 3.统计中所说的样本是指:
A.随意从总体中抽取出的部分个体 B.依照研究者要求从总体中抽取出有意义的部分个体 C.按照随机原则抽取总体中有代表性的部分个体 D.依照研究者要求从总体中抽取的部分个体 E.按分布的顺序抽取部分个体 4.统计中所说的总体是指:
A.随意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据时间来划分的研究对象的全体 D.根据地区来划分的研究对象的全体 E.根据人群来划分的研究对象的全体 5.总体的要求是:
A.大量的 B.同质的 C.随机的 D.固定的 E.对称的 6.对观察单位按某项指标等级顺序分组,再清点各组观察单位的个数所得资料称作: A.计量资料 B.计数资料 C.配对资料 D.相关资料 E.等级资料 7.对观察单位用定量的方法测量某项指标所得的资料是:
A.计量资料 B.计数资料 C.配对资料 D.相关资料 E.等级资料 8.样本指标值与总体指标值之差主要是指:
A.随机测量误差 B.过失误差 C.容许误差 D.抽样误差 E.系统误差
2
9.由于各种偶然的因素影响,造成同一对象的测定结果不完全一致,往往是有的稍高,有的稍低,这种差异是:
A.系统误差 B.随机测量误差 C.抽样误差 D.偏倚误差 E.标准误差 10.统计学上说的系统误差、测量误差和抽样误差三种误差,在实际工作中有: A.三种误差都不可避免 B.系统误差和抽样误差不可避免 C.系统误差和测量误差不可避免 D.测量误差和抽样误差不可避免 E.三种误差都可避免 11.抽样误差是指:
A.个体值和总体参数值之差 B.个体值和样本统计量值之差 C.样本统计量值和总体参数值之差 D.样本统计量值和样本统计量值之差 E.总体参数值和总体参数值之差 12.某事件发生的概率为1,即意味着:
A.某事件发生的可能性为1% B.某事件可能发生 C.某事件可能不发生 D.某事件必然不发生 E.某事件必然发生
13.除哪项外,是随机抽样方法:
A.单纯随机抽样 B.系统抽样 C.分层抽样 D.整群抽样 E.随意抽样 14.随机事件概率P值应是:
A.1 B.0 C.0~1 D.0.5 E.1~10 15.一时性资料主要来源:
A.日常工作记录 B.专用报告卡 C.统计报表 D.专题调查 E.病例档案 16.抽样调查是指:
A.从总体中随机抽取有代表性的一部分进行调查 B.从总体中任意选择一部分进行调查 C.从总体中选择典型进行调查 D.选择某一地区进行调查 E.调查总体所包含的每一个个体
17.医疗卫生工作对原始统计资料的要求:
A.完整,准确,及时,要有适当的数量,代表性和对比条件
B.字迹清楚 C.填写工整 D.避免重复 E.没有遗漏 18.同性三胞胎的身长、体重均有不同,认为是_____。
A.变异 B.同质 C.系统误差 D.抽样误差 E.随机测量误差 19.某医生对100名高血压病人采用某新疗法进行治疗,该研究的总体是_____。 A.全院收治的高血压病人 B.这100名高血压病人
C.该医生收治的所有病人 D.接受该新疗法的所有高血压病人 E.所有高血压病人。
20.某研究这在社区进行了1000名退休人员的冠心病患病率的抽样调查,计算的患病率为_____。 A.社区冠心病患病率参数 B.这1000名退休人员的冠心病患病率参数
3
C.所有退休人员的冠心病患病率参数 D.所有退休人员的冠心病患病率统计量 E.这1000名退休人员的冠心病患病率统计量
三、思考题
1.某地一批人的血红蛋白值资料,比色法测得的具体值(如135g/L),为何类资料?根据测得值进行分类(如“贫血”),为何类资料? 2.某疫苗皮下注射免疫结果
观察对象
1 2 ?
抗体滴度
1:40 1:60 ? 为何类资料?
目测判断抗体水平
++ ++++ ? 为何类资料?
免疫效果观察
无效 有效 ? 为何类资料?
3.数据类型的相互转换:如年龄(岁),为何类资料? 转换为“未成年、成人”,是何类资料? 再转换为“婴幼儿、青年、中年、老年”则又是何类资料?如治疗效果分类“无效、好转、显效、痊愈”为何类资料? 分别给予编码0,1,2,3后又为何类资料?。
4.某医科大学抽查了100名健康女大学生的血清总蛋白含量(g/L),检查结果如下:
74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 79.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 75.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 73.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 75.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 74.0 72.0 76.5 74.3 76.5 77.6 67.3 72.0 73.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 75.8 73.5 75.0 72.7 70.4 77.2 68.8 67.3 75.8 73.5 75.0 72.7 73.5 72.7 81.6 73.5 75.0 72.7 70.4 76.5 72.7 77.2 84.3 75.0 71.2 71.2 69.7 73.5 70.4 75.0 72.7 67.3 70.3 76.5 73.5 78.0 68.0 73.5 68.0 73.5 68.0 74.3 72.7 73.7 试回答以下问题:
1.这是总体还是样本资料?
2.上述资料的观察单位是什么?是数值变量还是分类变量? 3.怎样对这样一个资料(分布规律)进行简单描述? 参考答案 二、最佳选择题
1、A 2、A 3、C 4、B 5、B 6、E 7、A 8、D 9、B 10、D 11、C 12、E 13、E 14、C 15、D 16、A 17、A 18、A 19、D 20、E
4
统计表与统计图
一、最佳选择题
1、欲比较两地20年来冠心病和恶性肿瘤死亡率的上升速度,最好选用( )。 A.普通线图 B.半对数线图 C.条图 D.直方图 E.圆图 2、调查某地6至16岁学生近视情况,需描述近视学生的年龄分布可用( )。 A.普通线图 B.半对数线图 C.条图 D.直方图 E.圆图 3、比较某地在两个年份几种传染病的发病率可用( )。
A.构成比条图 B.复式条图 C.线图 D.直方图 E.圆图 4、图示7岁男孩体重与胸围的关系,宜绘制( )。
A.条图 B.百分条图 C.散点图 D.线图 E.直方图 5、表示某地区某年死因的构成比,可绘制( )。
A.条图 B.圆图 C.直方图 D.统计地图 E.线图 6、关于统计表的制作,不正确的叙述是( )。
A.统计表不用竖线和斜线分隔表、标目和数据 B.统计表的标题放在表的上方 C.统计表包含的内容越多越好 D.统计表中的数字按小数点位次对齐 E.统计表一般用纵标目和横标目说明数字的意义和单位 7、关于统计图的制作( )。
A.统计图的标题放在图的上方 B.线图中的线条越多越好 C.直条图的纵轴必须从零开始 D.直方图的组距不必相等 E、以上都不对
8、比较1955年某地三种传染病白喉、乙脑、痢疾的病死率,选择的统计图是( )。 A.线图 B.半对数线图 C.直方图 D.条图 E.百分条图 9、下列哪种统计图纵坐标必须从0开始( )。
A.半对数线图 B.散点图 C.条图 D.线图 E.百分条图
10、比较1949-1957年间某市儿童结核病和白喉的死亡率(l/10万)(两种疾病死亡率数量相差很大),宜采用( )。
A.条图 B.直方图 C.线图 D.半对数线图 E.散点图 11、要反映某一城市连续五年甲肝发病率的变化情况,应选用( )。 A.条图 B.直方图 C.线图 D.散点图 E.百分条图 12、关于统计表的列表原则,哪项是错误的( )。 A.标题在表的上端,“简要说明表的内容”
B.横标目是研究对象,列在表的右侧;纵标目是分析指标,列在表的左侧 C.线条主要有顶线,底线及纵标目下面的横线,不宜有斜线和竖线 D.数字右对齐,同一指标小数位数一致,表内不宜有空格 E.备注用“*”标出,写在表的下面 13、下列哪些统计图适用于计数资料( )。
5
A.条图、直方图 B.线图、半对数线图 C.条图、百分条图 D.散点图、线图 E.百分条图、直方图 14、半对数线图( )。
A.以对数的1/2值作纵横轴尺度 B.必须以纵轴为对数尺度,横轴为算术尺度 C.必须以横轴为对数尺度,纵轴为算术尺度 D.纵横轴之一为对数尺度,另一为算术尺度 E.纵横轴都必须为对数尺度
15、分析胎儿娩出时的不同体重(g)和围产儿死亡率的关系,宜绘制( )。 A.散点图 B.条图 C.线图 D.半对数线图 E.直方图 16、关于半对数线图,哪项是错误的( )。
A.纵轴为对数尺度,横轴为算术尺度 B.纵坐标没有零点 C.通过绝对差值而不是相对比来反映事物发展速度 D.纵坐标各单元等距,但同一单元内不等距
E.当事物数量相差悬殊时,比普通线图更适宜比较事物的发展速度 17、编制统计表的基本原则
A.简单明了,层次清楚 B.表式多样,标题合理 C.主谓分明,系统全面 D.排列规则,数字工整 E.表格整齐美观 18、对于绘制统计图的说法,较正确的是
A.纵坐标的起点一律为0
B.直条图是以各直线的面积大小来表示各指标的数值
C.是以各直线的面积大小来表示各指标的数值标题应简明扼要,一般放在图的上方 D.图例可放在图内任何地方,不宜太大
E.在绘制线图和直条图时,纵横坐标的长度的比例以5:7为宜 19、应用统计图必须根据资料的性质和分析目的,正确选择适宜的图形是:
A.连续性分组资料宜选用直条图
B.比较两种和两种以上事物变化速度,宜选用普通线图
C.表示某现象数量随另一现象而变动的幅度和趋势宜选用半对数线图 D.无连续关系的,相互独立的分组资料宜选用方图 E.要表示构成比与分布,可选构成图 20、列频数表时,分的组段数一般为:
A.5~10个 B.10~15个 C.10~30个 D.15~20个 E.>20个
二、简答题
1、在统计描述中,统计表和统计图分别起着什么作用? 2、统计表的制作原则和要求有哪些? 3、统计图的制作原则和要求有哪些?
4、常用的统计图有哪几种,各适用于什么类型资料? 5、统计表与统计图有何联系和区别?
6
三、计算分析题
1、对下表提出意见,并绘制改进后的统计表 职业 性别 男 女 合计 男 女 合计 男 女 合计 例数 102 80 182 77 86 163 107 91 198 发病率 例数 3 20 23 7 2 9 18 10 28 % 2.9 25.0 12.6 9.1 2.3 5.5 16.8 11.0 14.1 工人 农民 职员 2、评价下表是否符合统计表的制作原则,并请改进。
某地EB病毒抗体阳性人群药物干预治疗后EB病毒抗体阳性例数
第一疗程 1月 检查D V 人E N C 数 A A A se 328 252 84 52 第二疗程 3月 检查D V 人E N C 数 A A A se 306 229 62 28 2月 检查D V 人E N C 数 A A A se 315 237 78 46 1月 检查D V 人E N C 数 A A A se 283 192 56 22 2月 检查D V 人E N C 数 A A A se 272 168 44 20 3月 检查D V 人E N C 数 A A A se 266 144 38 18 血清学 指标 血清学 指标 血清学 指标 血清学 指标 血清学 指标 血清学 指标 3、某地两年三种死因别死亡率资料如下表,请绘制适合的统计图描述该资料。
某地两年的三种死因别死亡率(1/10万)
死因 肺结核 心脏病 恶性肿瘤
1952年 163.2 72.5 57.2
1992年 24.7 83.4 156.3
4、某医生统计某市机械工业生产性外伤例数见下表,请用适当的统计图描述。
1992年某市机械工业生产性外伤分类
外伤类型 创伤 挫伤 眼外伤 烧伤 其他 合计
病例数 381 305 118 92 43 939
百分比(%) 40.57 32.48 12.57 9.80 4.58 100.00
5、某医生在冠心病药物的动物实验中得到以下结果,试用适当的统计图描述。
家兔服药后血清总胆固醇的变化
7
组别 实验组 对照组
服药前 53.6 50.8
服药后
2周 815.8 818.1
4周 898.7 1081.1
6周 1298.9 1464.5
8周 1232.5 1645.5
10周 1179.4 1620.1
12周 1096.8 1411.0
6、某医生统计168例甲状腺功能亢进患者的年龄,结果如下表,请绘制合适的统计图。
甲状腺功能亢进患者的年龄分布
年龄 例数
0~ 1
10~ 13
20~ 51
30~ 61
40~ 35
50~ 6
≥60 1
合计 168
练习题解答
一、最佳选择题解答
1、B 2、D 3、B 4、C 5、B 6、C 7、C 8、C 9、D 10、D 11、C 12、B 13、C 14、D 15、A 16、C 17、A 18、E 19、E 20、B 三、计算分析题解答
1、答:该题没有标题,行的层次多,不应该有竖线,修改如下。
表1 某年某地不同职业居民高血压发病率 职业 工人 农民 职员
男
例数 102 77 107
发病数 发病率(%) 例数 3 7 18
2.9 9.1 16.8
80 86 91
20 2 10 女
发病数 发病率(%) 例数
25.0
2.3 11.0
182 163 198
合计
发病数 发病率(%) 23 9 28
12.6 5.5 14.1
2、答:该表的层次太多,描述资料不清楚,不方便比较。表的外框和竖线应该去掉。修改如下。
表2 某地EB病毒抗体阳性人群药物干预治疗后EB病毒抗体阳性例数
随访时间 1月 2月 3月
第一疗程
检查人数 328 315 306
VCA 252 237 229
EA 84 78 62
DNAse 52 46 28
检查人数 283 272 266
第二疗程 VCA 192 168 144
EA 56 44 38
DNAse 22 20 18
3、该资料是比较两个年度三种死因的变化,适宜用直条图,绘制如下。
4、答:该资料是描述生产性外伤的构成比,适宜用圆图或构成比直条图,绘制圆图如下。
8
其他烧伤5%眼外伤13%创伤40%挫伤32%
5、答:该资料是比较两组家兔的血清总胆固醇随时间变化而变化的趋势,适宜用线图。绘制如下。
1992年某市机械工业生产外伤性构成比
6、答:该资料是描述甲状腺功能亢进患者的年龄分布,适宜用直方图,绘制如下。
计量资料的统计描述
一、名词解释
1.中位数 2.四分位数间距 3.标准差 4.变异系数 5.正态分布
二、是非题
9
1.不论数据呈什么分布,都可以用算术均数和中位数表示其平均水平。( ) 2.少数几个数据比大多数数据大几百倍,一般不宜用算术均数表示其平均水平。( ) 3.只要单位相同,用s和用CV来表示两组资料的离散程度,结论是完全一样的。( ) 4.四分位数间距也是描述连续分布数据离散度的指标。( )
5.理论上,对于正态分布资料,总体百分位数的P5~P95和μ±1.96σ范围内都包含95%的变量值。( )
三、最佳选择题
1、描述一组偏态分布资料的变异度,以( )指标较好。
A.全距 B.标准差 C.变异系数 D.四分位间距 E.方差 2、用均数和标准差可以全面描述( )资料的特征/
A.正偏态分布 B.负偏态分布 C.正态分布 D.对称分布 E.对数正态分布 3、各观察值均加(或减)同一数后( )。
A.均数不变,标准差改变 B.均数改变,标准差不变
C.两者均不变 D.两者均改变 E.以上都不对 4、比较身高和体重两组数据变异度大小宜采用( )。
A.变异系数 B.方差 C.极差 D.标准差 E.四分位间距 5、偏态分布宜用( )描述其分布的集中趋势。
A.算术均数 B.标准差 C.中位数 D.四分位间距 E.方差 6、各观察值同乘以一个不等于0的常数后,( )不变。
A.算术均数 B.标准差 C.几何均数 D.中位数 E.变异系数 7、( )分布的资料,均数等于中位数。
A.对数正态 B.正偏态 C.负偏态 D.偏态 E.正态 9、最小组段无下限或最大组段无上限的频数分布资料,可用( )描述集中趋势。 A.均数 B.标准差 C.中位数 D.四分位间距 E.几何均数 10、血清学滴度资料最常用来表示其平均水平的指标是( )。
A.算术均数 B.中位数 C.几何均数 D.变异系数 E.标准差
11、中位数是表示变量值_______的指标。
A.平均水平 B.变化范围 C.频数分布 D.相互间差别大小 E.以上都不对 12、某项指标仅以过高为异常,且资料呈偏态分布,则其95%的参考值范围为 。 A.≤P95 B.≤P97.5 C.≥P5 D.P2.5~P97.5 E. ≥P2.5 13、在同一总体中随机抽样,样本含量n越大,则理论上_______越小。
A.样本标准差s B.中位数 C.标准误 D.第95百分位数 E. .变异系数 14、计算平均潜伏期宜用:
A.算术均数 B.全距 C.离均差积和 D.中位数 E.变异系数 15、正态分布有两个参数μ与σ,_____曲线的形状越扁平。
A. μ越大 B. μ越小 C. σ越大 D. σ越小 E. μ与σ越接近0 16、在医学和卫生学研究中,下面_____不是近似正态分布:
A.正常成人的血铅含量 B.正常成人的身高 C.正常成人的红细胞数
10
D.正常成人的血清总蛋白含量 E.正常成人的脉搏数 17、在抽样研究中“总体均数”,“总体标准差”:
A.一般是不知道的 B.不知道但可以由样本推论 C.总是知道的 D.是给定的两个已知量 E二者相等
18、对120名大学生的身高进行了测量,每个测量值减去均数所得的差值再除以标准差,所得数值的分布是______
A.正态分布 B.标准正态分布 C.正偏态分布 D.负偏态分布 E.偏态分布 19、若一组数据呈正态分布,其中大于x?2.58s的变量值占______
A.99.5% B.99% C.1% D.0.5% E.5%
四、简答题
1、对于一组近似正态分布资料,除样本含量n外,还可以计算X,S和 X土1.96S,问各说明什么?
2、试述正态分布、标准正态分布及对数正态分布的联系和区别。 3、说明频数分布表的用途,并思考频数表的组段数是否越多越好? 4、试述正态分布的面积分布规律。
5、医学中参考值范围的涵义是什么?确定的原则和方法是什么?
五、计算分析题
11
1、根据1999年某地某单位的体检资料,116名正常成年女子的血清甘油三脂(mmol/L)测量结果如下表,请据此资料:
(1)描述集中趋势应选择何指标?并计算之。 表1 甘油三脂(mmol/L)测量结果 (2)描述离散趋势应选择何指标?并计算之。
(3)求该地正常成年女子血清甘油三脂的95%参考值范围。 (4)试估计该地正常成年女子血清甘油三脂在0.8mmol/L
以下者及1.5mmol/L以下者各占正常女子总人数的百分比。
2、某地微丝蚴血症者42例治疗后7年用间接荧光抗体试验测得抗体滴度如下。求平均抗体滴度。 抗体滴度的倒数 例数
3、测得某地300名正常人尿汞值,其频数表如下。 试(1)请计算算术平均数、标准差和中位数。
(2)以双侧正态分布法和百分位数法估计95%变量值所在范围。 (3)以正态分布法和百分位数法估计95%变量值在什么数值以下。 (4)如果要制定正常值范围,你建议用哪一种方法?什么理由。
300例正常人尿汞值(μg / L)频数表
尿汞值 0~ 4~ 8~ 12~ 16~ 20~
4、100名健康成年女子血清总蛋白含量(g/L)如下表,试对资料进行描述。
12
组段 0.6~ 0.7~ 0.8~ 0.9~ 1.0~ 1.1~ 1.2~ 1.3~ 1.4~ 1.5~ 1.6~1.7 合计
频数 1 3 9 13 19 25 18 13 9 5 1 116
10 5
20 12
40 13
80 7
160 5
例数 49 27 58 50 45 22
尿汞值 24~ 28~ 32~ 36~ 40~ 44~
例数 16 9 9 4 5 0
尿汞值 48~ 52~ 56~ 60~ 64~ 68~
例数 3 0 2 0 0 1
100名成年健康女子血清总蛋白含量
73.5 72.0 68.0 73.5 68.0 74.3 72.7 72.7 74.3 70.4
74.3 79.5 75.0 73.5 75.8 70.4 73.5 67.2 75.8 73.5
78.8 75.6 75.0 75.8 72.0 79.5 76.5 73.5 79.5 73.5
78.0 78.8 74.3 64.3 76.5 74.3 74.7 70.4 72.7 76.5
70.4 72.0 75.8 75.8 70.4 76.5 65.0 77.2 73.5 72.7
80.5 72.0 65.0 80.3 71.2 77.6 76.5 68.8 73.5 77.2
84.3 72.7 67.3 81.6 67.3 81.2 69.7 74.3 72.0 80.5
68.8 75.0 78.8 72.0 68.8 76.5 73.5 72.7 75.0 70.4
69.7 74.3 71.2 74.3 75.0 72.0 75.4 67.3 81.6 75.0
71.2 71.2 69.7 73.5 70.4 75.0 72.7 67.3 74.3 76.5
练习题解答
三、最佳选择题
1、D 2、C 3、B 4、A 5、C 6、E 7、E 8、D 9、C 10、C 11、A 12、A 13、C 14、D 15、C 16、A 17、B 18、B 19、A 20、D 五、计算分析题
1、解 (1)X=1.16 (mmol/L) (2)S=0.20 (mmol/L)
(3)X土1.96S=(0.77,1.55) (mmol/L) (4) u1= - 1.80 u2= 1.70
该地正常成年女子血清甘油三脂在0.8mmol/L以下者占总人数的3.59%,1.5mmol/L以下者各占总人数的95.54%。
2、解:G=36.8 故42例微丝蚴血症者治疗后7年平均抗体滴度为1:36.8。 3、解:X =15.08 (μg / L)
M = 13.28 (μg / L) P95 = 36.0(μg / L) 自己联系SPSS统计软件 4、解:
(1)根据上述资料编制频数表,并SPSS作图如下: (2)根据频数表初步判断上述资料为 分布。
(3)计算均数、标准差、CV、极差、P25、P75及95%可信区间。
自己联系SPSS统计软件
13
总体均数的估计与假设检验
一、名词解释 1.抽样误差 2.标准误 3.置信区间 4.第一类错误 5.第二类错误
二、是非题
1.即使变量偏离正态分布,只要样本含量相当大,样本均数也近似正态分布。( ) 2.同一批计量资料的标准差不会比标准误大。( )
3.两次t检验都是对两样本均数的差别做统计检验,一次P<0.01,另一次0.01
4.对两样本均数的差别做统计检验,两组数据具有方差齐性,但与正态分布相比略有偏离,样本含量都较大,因此仍可做t检验。( )
5.t检验可用于同一批对象的身高与体重均数差别的统计检验。( )
三、最佳选择题
1、( )小,表示用该样本均数估计总体均数的可靠性大。
A、CV B、S C、?x D、R E、四分位间距 2、两样本均数比较的t检验,差别有统计学意义时,P越小,说明( )。 A、两样本均数差别越大 B、两总体均数差别越大 C、越有理由认为两总体均数不同 D、越有理由认为两样本均数不同 E、越有理由认为两总体均数相同
3、甲乙两人分别随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得X1和S12,
X2和S22,则理论上( )。
A、X1=X22
2 B、S1= S2
C、作两样本均数的t检验,必然得出无差别的结论 D、作两方差齐性的F检验,必然方差齐
E、由甲、乙两样本均数之差求出的总体均数的95%可信区间,很可能包括0 4、在参数未知的正态总体中随机抽样,∣X- μ∣≥( )的概率为5%。
A、1.96σ B、1.96 C、2.58 D、t0.05,v S E、t0.05,v sx
5、某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L,标准差为4g/L,则其95%的参考值范围( )。
A、74±4×4 B、74±1.96×4 C、74±2.58×4 D、74±2.58×4÷10 E、74±1.96×4÷10
14
6、关于以0为中心的t分布,错误的是( )。
A、t分布是一簇曲线 B、t分布是单峰分布 C、当ν ∝时,t u D、t分布以0为中心,左右对称 E、相同ν时,∣t∣越大,P越大 7、在两样本均数比较的t检验中,无效假设是( )
A、两样本均数不等 B、两样本均数相等 C、两总体均数不等 D、两总体均数相等 E、两样本均数等于总体均数
8、两样本均数比较时,分别取以下检验水准,以( )所取第二类错误最小。
A、α= 0.01 B、α= 0.05 C、α= 0.10 D、α= 0.20 E、α= 0.30 9、正态性检验,按α= 0.10水准,认为总体服从正态分布,此时若推断有错,其错误的概率( )。 A、大于0.10 B、小于0.10 C、等于0.10 D、等于β,而β未知 E、等于1-β,而β未知
10、关于假设检验,下面哪一项说法是正确的( )。 A、单侧检验优于双侧检验
B、若P>α,则接受H0犯错误的可能性很小
C、采用配对t检验还是两样本t检验是由试验设计方案所决定的 D、检验水准α只能取0.05 11、第1类错误的概念是( )
A. H0是对的,统计检验结果未拒绝H0 B. H0是对的,统计检验结果拒绝H0 C. H0是不对的,统计检验结果未拒绝H0 D. H0是不对的, 统计检验结果拒绝H0 E. 以上都不对
13、在研究两种药物治疗高血压效果的配对t检验中,要求( )
A.两组样本的方差相等 B.数据呈双变量正态分布 C.差数d服从正态分布 D.差数d的方差为0 E.n比较小
14、由两样本均数的判别来推断两总体均数的差别,所谓差别有显著性是指: A.两样本均数差别有显著性 B.两总体均数差别有显著性
C.两样本均数和总体均数的差别都有显著性 D.其中有一个样本均数和总体均数的差别有显著性 E.两样本均数和一个总体均数的差别有显著性 15、统计推断的内容是( )
A.计算样本率 B.检验统计上的“假设” C.计算样本均值 D.计算标准化率 E.估计参考值范围 16、在同一总体随机抽样,其他条件不变,样本含量越大,则______。
A.样本标准差s越大 B.样本标准差s越小 C.总体均数的95%可信区间越窄 D.总体均数的95%可信区间越宽 E. 样本标准差s越小,总体均数的95%可信区间越窄 17、在同一总体随机抽样,样本含量n固定时,α越小,总体均数可信区间x?u??x_______。 A.越宽 B.越窄 C.宽窄不变 D.宽窄还与β有关 E.以上说法都不对 18、在随机抽样中,其他条件不变时,“增大样本含量能平均起来使_______”是错误的。 A . uα变小 B.sx变小 C.可信区间变窄 D.
15
?x变小 E.都是错误的
19、在同一总体随机抽样,样本含量n固定时,α越小,用区间x?u??x估计总体均属μ,估计_____ A、错的概率越大 B、错的概率越小 C、错的概率不变 D、其精度越差 E、以上说法都不对
20、在参数未知的正态总体中随机抽样,X???______的概率为5%。 A.1.96σ B.1.96 C.2.58 D.t0.05S E. t0.05SX
四、简答题
1、试举例说明均数的标准差与标准误的区别与联系。 2、标准正态分布(u分布)与t分布有何不同? 3、均数的可信区间与参考值范围有何不同?
4、假设检验时,一般当P<0。05时,则拒绝H0,理论根据是什么? 5、假设检验中α和P的区别何在? 6、怎样正确选用单侧检验和双侧检验? 7、t检验的应用条件是什么?
8、Ⅰ型错误与Ⅱ型错误有何区别与联系?了解这两类错误有何实际意义? 9、假设检验和区间估计有何联系? 10、为什么假设检验的结论不能绝对化?
五、计算分析题
1、某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果如下表:请就下表资料: (1)说明女性的红细胞数与血红蛋白的变异程度何者为大? (2)计算男性两项指标的抽样误差。
(3)试估计该地健康成年女性红细胞数的均数。 (4)该地健康成年男、女血红蛋白是否不同?
(5)该地男性两项血液指标是否均低于上表的标准值(若测定方法相同)?
某年某地健康成年人的红细胞数和血红蛋白含量
指标 红细胞(10/L)
12
性别 男 女 男 女
例数 360 255 360 255
均数 4.66 4.18 134.5 117.6
标准差 0.58 0.29 7.1 10.2
标准值 4.84 4.33 140.2 124.7
血红蛋白(g/L)
*《实用内科学》(1976年)所载均数(转为法定单位)
2、一药厂为了了解其生产的某药物(同一批次)之有效成份含量是否符合国家规定的标准,随机抽取了该药10片,得其样本均数为103.0mg,标准差为2.22mg。试估计该批药剂有效成份的平均含量。
3、通过以往大量资料得知某地20岁男子平均身高为1.68米,今随机测量当地16名20岁男子,
16
得其平均身高为1.72米,标准差为0.14米。问当地现在20岁男子是否比以往高?
4、为了解某一新降血压药物的效果,将28名高血压病患者随机分为试验组和对照组,试验组采用新降压药,对照组则用标准药物治疗,测得治疗前后的舒张压(mmHg)如下表。问: (1)新药是否有效?
(2)要比较新药和标准药的疗效是否不同,请用下述两种不同方式进行检验:Ⅰ仅考虑治疗后的舒张压;Ⅱ考虑治疗前后舒张压之差。您认为两种方法各有何优缺点?何种方法更好?
两种药物治疗前后的舒张压(mmHg)
新药 标准药
5、将钩端螺旋体病人的血清随机分为两组,分别用标准株和水生株作凝溶试验,测得稀释倍数如下表,问两组的平均效价是否不同?
钩端螺旋体患者血清作凝溶试验测得的稀释倍数 标准株(11人) 100 水生株(9人) 100
6、某医师观察某新药治疗肺炎的疗效,将肺炎病人随机分为新药组和旧药组,得两组的退热天数如下表。
(1)计算两药平均退热天数之差的95%CI。 (2)对两药平均退热天数是否不同进行假设检验。 (3)上述两种方法有何联系?
新旧两药的退热天数
分组 新药 旧药
7、为比较治疗组和对照组的肺表面活性物质PaO2在治疗新生儿呼吸窘迫综合征患儿过程中的作用是否不同,某医生在治疗30名患儿后48小时得到如下表资料,问治疗后48小时,两组的PaO2是否不同?
两组患儿PaO2(kPa)比较
例数 35 37
平均退热天数
3.8 5.2
退热天数的标准差
0.8 0.9
200 100
400 100
400 200
400 200
400 200
800 200
1600 1600 400
400
1600
3200
病人号 治疗前 治疗后 病人号 治疗前 治疗后
1
2
3
4 98 90 4
5
6
7
8
9
10
11
12
13
14
102 100 92 90 1 98
90 2
85 3
118 100 102 116 109 116 92 114 95 5
6
86 7
84 8
98 9
103 88 10
11
108 102 100 100 88 12
13
86 14
103 110 110 110 94
100 105 110 96
104 92 94
108 110 112 92 104 90 100 85
100 94 100 104 109 100 95
17
分组 治疗组 对照组
例数 15 15
均数 12.55 9.72
标准差 0.33 2.03
8、随机抽查上海地区男孩出生体重,得到如下数据: 出生体重 人数
2.0~ 1
2.2~ 2
2.4~ 5
2.6~ 10
2.8~ 12
3.0~ 24
3.2~ 23
3.4~ 22
3.6~ 17
3.8~ 7
4.0~ 3
4.2~ 2
4.4~4.6 1
请分析计算:
(1)理论上99%男孩的出生体重在什么范围? (2)估计全市男孩出生体重均数在什么范围? (3)某男孩出生体重均数为4.51kg,怎么评价?
(4)郊区随机抽查男孩100人,得出出生体重均数为3.23 kg,标准差为0.47 kg,问市区和郊区男孩出生体重均数是否相同?
(5)以前上海市区男孩出生体重均数为3.0 kg,问现在男孩出生体重均数是否更大了?
练习题答案
二、最佳选择题
1、C 2、C 3、E 4、E 5、B 6、E 7、D 8、E 9、 D 10、C 11、B 13、C 14、A 15、B 16、C 17、A 18、AE 19、BD 20、E 五、计算分析题解答 1、解:
(1)女性两项指标的CV: CVRBC = 6.94% CVHb = 8.67%
(2) 男性两项指标的抽样误差: 红细胞数:sx=0.031 (1012/L) 血红蛋白:sx=0.374 (g/L) (3) (4.14,4.22) (1012/L) (4) u =22.83
(5) 红细胞数u = - 5.888 血红蛋白u = - 15.232 2、解:sx= 0.702
(101.41,104.59 )mg 3、解:t = 1.143 4、解:(1)t = 5.941
18
(2)要比较新药和标准药的疗效是否不同,若仅考虑治疗后的舒张压是否不同,不考虑治疗前两组舒张压的基线水平是否不同,这明显不妥当。尽管在设计时考虑到随机将高血压病人分配到新药组和标准药组,但对新药组和标准药组来说,由于不是配对设计,加之样本含量较小,最终结果完全可能是其治疗前的舒张压基线水平在两组间不同。而采用治疗前后的差值d则可消除治疗前舒张压基线水平不同对结果的影响,无论治疗前舒张压水平是否相同均可进行检验,该d值也正好反映的是药物的降压效果,故第二种方法较好。现给出第二种方法的结果(以新药组治疗前后舒张压之差为d1,标准药组治疗前后舒张压之差为d2),先对两差值做Levene方差齐性检验。
Levene检验F= 0.000, P=1.000(计算机结果)
按α=0.10水准,不拒绝H0,无统计学意义,还不能认为两总体方差不等。可进行总体方差齐性情形下的t检验。t = 3.281
SPSS主要输出结果如下:
(1) Paired Samples Statistics Std. Error Pair 1 疗前 疗后 Mean 103.9286 92.6429 N 14 14 Std. Deviation 8.36167 8.49078 Mean 2.23475 2.26926 Paired Samples Test Paired Differences Std. Error Mean 11.2857 Std. Deviation 7.10827 Mean 1.89976 95% Confidence Interval of the Difference Lower 7.1815 Upper 15.3899 5.941 13 .000 t df Sig. (2-tailed) (2)I:Group Statistics
Std. Error 疗后 组别 新药 标准药
Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means N 14 14 Mean 92.6429 99.4286 Std. Deviation 8.49078 6.53646 Mean 2.26926 1.74694 19
Std. Error Sig. Equal variances assumed Equal variances not assumed II:
Group Statistics -2.369 24.403 .026 -6.7857 2.86380 1.249 .274 -2.369 26 .026 -6.7857 2.86380 F Sig. t df (2-tailed) Mean Difference Difference 95% Confidence Interval of the Difference Lower -12.67233 -12.69113 Upper -.89909 -.88029 Std. Error 治疗前-治疗后
Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means Std. Error Mean Equal variances assumed Equal variances not assumed F .000 Sig. 1.000 t 3.281 3.281 df 26 25.067 Sig. (2-tailed) Difference .003 .003
8.0714 8.0714 Difference 2.45980 2.45980 95% Confidence Interval of the Difference Lower 3.01523 3.00605 Upper 13.12762 13.13680 组别 新药 标准药 N 14 14 Mean 11.2857 3.2143 Std. Deviation 7.10827 5.84648 Mean 1.89976 1.56254 5、解:血清抗体滴度或稀释倍数资料常服从对数正态分布,故可将原始数据取自然对数后再作两样本t检验。
先作Levene方差齐性检验。若以算术均数算得,可认为两总体方差不等;而以中位数算得,还不能认为两总体方差不等。
下面分别给出总体方差不等和相等情形下的t检验计算机结果。 t′= 15.6 0.02
20
首先将原始数据取自然对数,对转换后数据作两组独立样本的t检验主要结果如下:
Group Statistics Std. Error 对数转换后稀释倍数 水生株 组别 标准株 N 11 9 Mean 2.7936 2.2676 Std. Deviation .45200 .23533 Mean .13628 .07844 Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means 95% Confidence Sig. Equal variances assumed Equal variances not assumed F 5.063 Sig. .037 t 3.149 df 18 15.585 (2-tailed) .006 .004 Mean Difference .5260 .5260 Std. Error Difference .16704 .15725 Interval of the Difference Lower .17511 .19197 Upper .87698 .86011 3.345 6、解:
(1)(1.00,1.80)天 (2)F= 1.266 P>0.10 t = 6.961
(3) 上述两种方法的联系在于:均可得到新药和旧药的退热天数不同的结论,也就是说可信区间(1.00,1.80)天没有包括0(即H0:μ1-μ2 = 0) 7、解:F = 37.841 P<.0.10 t′= -5.329 P<.0.001
8、解:(1)估计全市男孩出生体重的95%正常值范围:(2.427,4.145)。
(2)99%可信区间:(3.187,3.386)。
(3)该男孩的出生体重超出了绝大多数正常出生男孩体重的波动范围。
(4)方差齐性检验略。t=2.055,P<0.05,可以认为市区和郊区男孩出生体重均数存在差异。 (5)?
多个样本均数比较的方差分析
一、是非题
1.方差分析是研究两个或多个总体均数的差别有无统计意义的统计方法。( ) 2.样本均数的差别做统计检验,若可做方差分析,则也可以做t检验。( )
21
3.随机区组设计和完全随机设计方差分析的统计效能是一样的。( )
4.4个均数做差别的假设检验,可以分别做两两比较的6次t检验以进一步详细分析。( ) 5.如果把随机区组设计资料用完全随机设计方差分析法作分析,则前者的SS区组+SS误差=后者的SS组
内
。( )
6、完全随机设计方差分析中的组内均方就是误差均方。( )
7、方差分析中的误差均方的总体平均数理论上不会大于处理组间均方。( )
8、方差齐性检验结果P<α,则在α水平上拒绝H0,可认为样本满足方差齐性要求。( )
二、最佳选择题
1、完全随机设计资料的方差分析中,必然有( )。
A、SS组间 > SS组内 B、MS组间 > MS组内 C、MS总 = MS组间 + MS组内D、SS总 =SS组间 + SS组内 E、ν组间 > ν组内 2、在完全随机设计资料的方差分析中,有( )。
A、MS组内 > MS误差 B、MS组内 < MS误差 C、MS组内 = MS误差 D、MS组间 = MS误差 E、MS组内 < MS组间
3、当组数等于2时,对于同一资料,方差分析结果与t检验结果( )。 A、完全等价且F= t开根号 B、方差分析结果更准确 C、t 检验结果 更准确 D、完全等价且t= F开根号 E、理论上不一致
4、方差分析结果,F处理>F0.05(ν1. ν2),则统计推论是( )。 A、各总体均数不全相等 B、各总体均数都不相等 C、各样本均数都不相等 D、各样本均数间差别都有显著性 E、各总体方差不全相等
5、完全随机设计方差分析的实例中有( )。
A、组间SS不会小于组内SS B、组间MS不会小于组内MS C、F值不会小于1 D、F值不会是负数 E、F值不会是正数
6、完全随机设计方差分析中的组间均方是( )的统计量。
A、表示抽样误差大小 B、表示某处理因素的效应作用大小 C、表示某处理因素的效应和随机误差两者综合的结果
D、表示N个数据的离散程度 E、表示随机因素的效应大小
7、配对设计资料,若满足正态性和方差齐性。要对两样本均数的差别作比较,可选择( A、随机区组设计的方差分析 B、u检验 C、成组t检验 D、χ2检验 E、秩和检验 8、k 个组方差齐性检验有显著性,可认为( )。
A、σ12,σ22,?σk2不全相等 B、μ1,μ2,?μk不全相等 C、S1,S2,?SK不全相等 D、X1,X 2,?X K不全相等 E、σ12,σ22,?σk2全不相等
22
。 )9、方差分析可用于_______关系的分析。
A、职业和中性粒细胞占白细胞总数的比例 B、血型和血红蛋白含量 C、职业和血型 D、产妇年龄和难产 E、职业与肺癌 11、方差分析的应用条件是方差齐性,所谓方差齐性是指________。 A.各比较组的样本方差相等 B.组内方差=组间方差
C.各比较组的总体方差相等 D.总方差=各组方差之和 E.以上说法都不对 12、配伍组设计中,同一配伍组中的各观察个体要求_______。
A.是同一个个体 B.给予相同的处理 C.给予不同的处理 D.相互间的差别越大越好 E.除处理因素外,其他已知或可能影响观察指标(效应指标)的因素和条件都相同或相近。 13、为研究血型 与血红蛋白含量的关系,随机抽查100人的血型与血红蛋白含量后作方差分析,若结果是P<0.05,则在α水平上可认为______,血型与血红蛋白含量有关。 A.这100人中不同血型者的血红蛋白含量均数不全相同 B.这100人中不同血型者的血红蛋白含量均数不相同 C.不同血型者的血红蛋白含量均数不全相同 D.不同血型者的血红蛋白含量均数都不相同 E.以上说法都不相同
14、配伍组设计资料方差分析中,为推断处理因素是否起作用,所查F临界值表中的分母自由度为______自由度。
A.处理组 B.误差 C.配伍组 D.总 E.以上都不是
15、在相同自由度(ν1,ν2)及α水准时,方差分析的界值比方差齐性检验的界值______。 A.大 B.小 C.相等 D.前者是后者的两倍 E.不一定
三、简答题
1、方差分析的基本思想和应用条件是什么?
2、在完全随机设计方差分析中SS组间、SS组内各表示什么含义?
3、随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什么不同? 4、如何确定应用于试验的拉丁方?
5、为什么在方差分析的结果为拒绝H0、接受H1之后,对多个样本均数的两两比较要用多重比较的方法?
6、何为单因素分析和两因素分析?各适用于什么情况?
7、配伍组设计方差分析的特点是什么?怎么使配伍组设计方差分析的设计做得更好?请举例说明? 8、方差分析的无效假设是否可以是“各总体均数不都相等”,为什么?
四、计算分析题
1、某职业病防治所对30名矿工分别测定血清铜蓝蛋白含量(μmol/L),资料如下。问各期血清铜蓝蛋白含量的测定结果有无差别?
23
0期 0~I期 I期
8.0 8.5 11.3
9.0 4.3 7.0
5.8 11.0 9.5
6.3 9.0 8.5
5.4 6.7 9.6
8.5 9.0 10.8
5.6 10.5 9.0
5.4 7.7 12.6
5.5 7.7 13.9
7.2 6.5
5.6
2、某医师研究有不同程度腹水的肝硬化患者血浆肾素活性,随机抽取并测得不同程度腹水的肝硬化患者血浆肾素活性的结果如下表所示。问4种对象血浆肾素活性均数有无差别?并请对有不同程度腹水的肝硬化患者血浆肾素活性均值进行两两比较。
组别 大量腹水(1) 有腹水(2) 无腹水(3) 对照(4)
3、 为研究注射不同剂量雌激素对大白鼠子宫重量的影响,取4窝不同种系的大白鼠,每窝3只,随机地分配到3个组内接受不同剂量雌激素的注射,然后测定其子宫重量,结果见下表。问注射不同剂量的雌激素对大白鼠子宫重量是否有影响?
大白鼠种系
A B C D
4.某医师研究克山病与血磷值的关系,在某地通过随机抽样测定急性克山病患者与克山病区健康人的血磷值如表190,问克山病患者与克山病区健康人的血磷值有无差异。用方差分析和t检验两种方法作分析,并对结果作比较。 组别 血磷值 0.25 108 46 70 43
雌激素剂量(μg/100g)
0.5 112 64 96 65
0.75 142 116 134 98
13.1 2.3 0.33 0.00 9.6 7.5 2.1 0.41 5.2 4.6 3.5 0.52 血浆肾素活性 9.4 6.7 0.87 0.74 13.8 5.8 0.72 0.64 24.7 7.2 0.64 0.83 5.00 0.46 0.65 8.90 0.45 克山病人 2.60 3.24 3.73 3.73 4.32 4.73 5.18 5.58 5.78 6.40 6.53 健康人
5.某医师要研究用含有不同营养素的饲料喂养大鼠14周后的血胆固醇的差别,进行试验后获得如下资料,请填补下面表格中的空格,并进行统计分析。
组别 猪油 鱼油 茶油
动物数 8 9 12
1.67 1.98 1.98 2.33 2.34 2.50 3.60 3.73 4.14 4.17 4.57 4.82 5.78 x
3.2
s
0.6 0.4 0.4
?X
17.1 33.6
?X
2 95.84
24
参考答案
二、最佳选择题
1.D 2.C 3.D 4.A 5.D 6.C 7.A 8.A 9.B 10.C 11.C 12.E. 13.C 14.B 15.B 四、计算分析题
1.解:采用完全随机设计资料的方差分析。F=7.71,P<0.01。 结论:可以认为3期血清铜蓝蛋白含量的测定结果有差别。 SPSS主要输出结果如下:
(1)方差齐性检验
Levene's Test of Equality of Error Variances(a) Dependent Variable: 铜蓝蛋白含量 F .959 df1 2 df2 27 Sig. .396 Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a Design: Intercept+分期 (2)方差分析结果
Dependent Variable: 铜蓝蛋白含量 Type III Sum of Source Intercept Hypothesis Error 分期 Hypothesis Error a .997 MS(分期) + .003 MS(Error) b MS(Error)
Squares 2021.567 56.928 57.045 99.963 df 1 2.002 2 27 Mean Square 2021.567 28.439(a) 28.523 3.702(b) F 71.084 7.704 Sig. .014 .002 Tests of Between-Subjects Effects
2.解:(1)首先采用完全随机设计资料的方差分析。F=19.7,P<0.01。 结论:不同程度腹水的肝硬化患者血浆肾素活性总体均数不全相同。 (2)进行各均数两两比较。
结论:除了无腹水组的肝硬化患者血浆肾素活性均值与对照组总体均数误差别外,其余个组总体均数间均有差别。
SPSS主要输出结果如下: 方差齐性检验:
Levene's Test of Equality of Error Variances(a)
Dependent Variable: 肾素活性 F 5.521
df1 3 df2 25 Sig. .005 25
Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a Design: Intercept+组别
方差分析结果:
Tests of Between-Subjects Effects Dependent Variable: 肾素活性 Type III Sum of Source Intercept Hypothesis Error 组别 Hypothesis Error Squares 743.393 609.459 614.470 259.886 df 1 3.003 3 25 Mean Square 743.393 202.953(a) 204.823 10.395(b) F 3.663 19.703 Sig. .151 .000 a .990 MS(组别) + .010 MS(Error) b MS(Error)
两两比较结果:
Pairwise Comparisons Dependent Variable: 肾素活性 Mean Difference (I-J) 6.633(*) 11.402(*) 12.103(*) -6.633(*) 4.769(*) 5.470(*) -11.402(*) -4.769(*) .701 -12.103(*) -5.470(*) -.701 95% Confidence Interval for Difference(a) Std. Error 1.741 1.794 1.741 1.741 1.669 1.612 1.794 1.669 1.669 1.741 1.612 1.669 Sig.(a) .001 .000 .000 .001 .008 .002 .000 .008 .678 .000 .002 .678 Lower Bound 3.047 7.708 8.517 -10.220 1.332 2.150 -15.096 -8.205 -2.735 -15.690 -8.790 -4.138 Upper Bound 10.220 15.096 15.690 -3.047 8.205 8.790 -7.708 -1.332 4.138 -8.517 -2.150 2.735 (I) 组别 1 (J) 组别 2 3 4 2 1 3 4 3 1 2 4 4 1 2 3 3.解:采用随机区组设计资料方差分析,
结论:可以认为3种雌激素注射的大白鼠子宫重量的总体均数不全相等,即不同剂量雌激素对大白鼠子宫重量有影响。 SPSS主要输出结果如下: 方差齐性检验
Levene's Test of Equality of Error Variances(a) Dependent Variable: 子宫重量
26
F .400 df1 2 df2 9 Sig. .682 Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a Design: Intercept+剂量组
方差分析结果
Dependent Variable: 子宫重量 Type III Sum of Source Intercept Hypothesis Error 剂量组 Hypothesis Error a MS(剂量组) b MS(Error)
Squares 99736.333 6503.167 6503.167 5550.500 df 1 2 2 9 Mean Square 99736.333 3251.583(a) 3251.583 616.722(b) F 30.673 5.272 Sig. .031 .031 Tests of Between-Subjects Effects
4.解:(1)作完全随机设计方差分析 (2)作成组比较的t检验
结论:两种统计检验方法等价,结论相同。 SPSS主要输出结果如下: (1)完全随机设计方差分析
Levene's Test of Equality of Error Variances(a)
Dependent Variable: 血磷值 F .038 df1 1 df2 22 Sig. .847 Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a Design: Intercept+组别
Tests of Between-Subjects Effects
Dependent Variable: 血磷值 Type III Sum of Source Intercept Hypothesis Error Squares 387.606 10.961 df 1 1 Mean Square 387.606 10.961(a) F 35.364 Sig. .106
27
组别 Hypothesis Error 10.961 37.394 1 22 10.961 1.700(b) 6.448 .019 a MS(组别) b MS(Error) (2)t检验
Independent Samples Test Levene's Test for Equality of Variances Sig. 血磷值 Equal variances not assumed 2.540 21.354 .019 1.3563 .53406 .24678 2.46580 Equal variances assumed .038 .847 2.539 22 .019 1.3563 .53411 .24863 2.46396 F Sig. t df (2-tailed) t-test for Equality of Means 95% Confidence Mean Difference Std. Error Difference Interval of the Difference Lower Upper 5.解:(1)方差分析用基本数据
组别 猪油 鱼油 茶油
(2)方差分析表
来源 总 组间 组内
SS 13.3 7.74 5.56
ν 28 2 26
MS 3.87 0.21
F 18.43
动物数 8 9 12
x
3.2 1.9 2.8
s
0.6 0.4 0.4
?X
25.6 17.1 33.6
?X2
84.44 33.77 95.84
结论:含有不同营养素的饲料喂养大鼠14周后的血胆固醇总体均数不全相同。
χ2检验
一、是非题
1.调查100名乳腺癌患者中有60名无哺乳史,故可以认为无哺乳史是妇女患乳腺癌的危险因素之一。( )
2.对两厂工人总的肝炎患病率做比较,可对率做标准化以同时校正性别与年龄构成对总率的影响。( )
28
3.3个医院的门诊疾病构成做比较,不可做卡方检验。( )
4.用甲、乙两药治疗某病,甲组400人,乙组4人,治愈数分别为40人和0人,要研究两药差别不可做卡方检验。( )
5.有理论数小于1时,3行4列的表也不能直接做卡方检验。( )
二、最佳选择题
1、χ2分布的形状( )。
A.同正态分布 B.同t分布 C.为对称分布 D.与自由度ν有关 E.与样本含量n有关
2、χ2值的取值范围( )。
A.—∝<χ2<∝ B.χ2≤1 C.0≤χ2≤∝ D.χ2≥1 E.—∝≤χ2≤0
3、当四格表的周边合计数不 变时,如果某格的实际频数有变化,则其理论频数( )。
A.增大 B.减小 C.不变 D.不确定 E.随该格实际频数的增减而增减 4、四格表的自由度( )。
A.不一定等于1 B.一定等于1 C.等于行数×列数 D.等于样本含量—1 E.等于格子数-1 5、对于总合计数n为500的5个样本率的资料做χ2检验,其自由度为( )。 A.499 B.496 C.1 D.4 E.9 6、5个样本率做比较,χ2>χ20.01,4,则在α = 0.05检验水准下,可认为( )。 A.各总体率不全等 B.各总体率不等 C.各样本率均不等 D.各样本率不全等 E.至少有两个总体率相等 计数资料的统计分析
7、4个比例做比较,有一个理论数小于5大于1,其他都大于5, 。 A.只能做校正卡方检验 B.不能做卡方检验 C.做卡方检验不必校正 D.必须先作合理的合并 E.以上都不对
8、四格表卡方检验中,???0.05(?), 。 A.可认为两样本比例不同 B.可认为两样本比例相同 C.可认为两总体比例相同 D.可认为两总体比例不同 E.以上都不对
9、四格表中如有一个实际数为0, 。 A.不能做卡方检验 B.必须用校正卡方检验 C.还不能决定是否可做卡方检验 D.肯定可做校正卡方检验 E.一定要用四格表确切概率法
10、两个样本构成比(实际的数字分别为25/80和60/75)的差别做统计检验,如果可比性方面没有问题, 。
A.可做卡方检验 B.不可做卡方检验 C.看不出能否做卡方检验 D.只能做卡方检验 E.以上都不对
11.某医师用手术治疗椎间盘突出患者26人,19例有效;注射疗法治疗25人,12人有效。若进行χ2
22 29
检验,其自由度为_______
A.1 B.2 C.3 D.4 E.以上都不对
12.从甲、乙两文中,查到同类研究的两个率比较的四格表资料,其χ2检验甲文?2?2??0.05(1),可认为_______
22??0.01(1),乙文
A.两文结果有矛盾 B.两文结果基本一致 C.甲文结果更可信 D.甲文结果不可信 E.甲文说明总体的差别大
三、简答题
1、说明χ2检验的用途。
2、两样本比较的u检验与χ2检验有何异同? 3、对于四格表资料,如何正确选用检验方法? 4、说明行×列表资料χ2检验应注意的事项。 5、说明R×C表的分类及其检验方法的选择。
四、计算分析题
1、某院康复科用共鸣火花治疗癔症患者56例,有效者42例;心理辅导法治疗癔症患者40例,有效者21例。问两种疗法治疗癔症的有效率有无差别?
2、某院内科用某疗法治疗一般类型胃溃疡患者62例,治愈50例;治疗特殊类型胃溃疡病患者55例,治愈18例。试评价该疗法对不同类型胃溃疡的治愈率有无差别?
3、用兰芩口服液治疗慢性咽炎患者34例,有效者31例;用银黄口服液治疗慢性咽炎患者26例,有效者18例。问两药治疗慢性咽炎的有效率有无差别?
4、某研究者将腰椎间盘突出症患者1184例,随机分为三组,分别用快速牵引法、物理疗法和骶裂孔药物注射法治疗,结果如下表。问三种疗法的有效率有无不同?
三种疗法治疗腰椎间盘突出有效率的比较
疗法 快速牵引法 物理疗法 骶裂孔药物注射法 合计
5、某省观察三个地区的花生污染黄曲霉素B1的情况,如下表。问三个地区花生的黄曲霉素B1污染率均有差别吗?
某省三个地区花生的黄曲霉B1污染率比较
地区 甲 乙
有效 444 323 222 989
无效 30 91 74 195
合计 474 414 296 1184
未污染 6 30
污染 23 14
30
合计 29 44
污染率(%)
79.3 31.8
丙 合计
8 44
3 40
11 84
27.3 47.6
6、某研究者检测脑梗死组与对照组血清中Apo(a)表型的分布,结果如下表。问病例与对照两组的构成比有无不同?
脑梗死组与对照组血清中Apo(a)表型的分布
分组 病例组 对照组 合计
7、某胸科医院,同时用甲、乙两法测定202份痰标本中的抗酸杆菌,结果如下表。问甲、乙两法的检出率有无差别?
甲、乙两法检测痰标本中的抗酸杆菌结果 甲法 + — 合计
8、某研究者将PD型乳腺癌患者按不同首发症状分为两组,观察其液窝淋巴结转移情况如下表。问两种乳腺癌液窝淋巴结转移率有无不同?
两组PD型乳腺癌患者液窝淋巴结转移率的比较 组别 乳头病变 乳腺病变 合计
9、某医院内科血液病组用某疗法治疗血友病患者14例,其中AL血浆诱导率≤0.7的患者5例全部死亡,而>0.7的9例患者中有2例死亡,7例存活,该组据此得出AL血浆诱导率≤0.7者比>0.7者死亡率高的结论。该结论正确吗?应如何分析该资料?
10、某院内科研究急慢性白血病与血型之间有无关系,资料如下表,问白血病的种类与患者血型有无关联性?
白血病种类与血型的关系
白血病 急性 慢性 合计
S1 12 6 18
S2 9 12 21
S2+S3 8 4 12
S3 21 27 48
S4 14 20 34
Null 4 8 12
合计 68 77 145
乙法 + 49 21 70
— 25 107 132
合计 74 128 201
+ 3 5 8
— 8 6 14
合计 11 11 22
A 58 43 101
B 49 27 76
O 59 33 92
31
AB 18 8 26
合计 184 111 295
11、(不要求做)某单位医院在冠心病普查中欲研究冠心病与眼底动脉硬化的关系,资料如下表。问两者之间是否存在线性趋势关系?
某单位职工冠心病与眼底动脉硬化普查结果
眼底动脉硬化
级别 0 1级 2级 3级 合计
12、(不要求做)某省某年男女活产儿构成比分别为51.5%和48.5%。今将该省某院妇产科接生的活产儿顺序连续记录500例,以每10名新生儿为一组,统计其男婴数,结果如下表。问该资料是否服从二项分布?
某院每10名活产儿中男婴数的分布
男婴数X
0 1 2 3 4 5
13、根据下表资料回答:
(1) 各年龄组相比,哪个年龄组的患者最多? (2) 哪个年龄组的人患肿瘤的比例最高?
某地、某年肿瘤普查资料
年龄(岁)
0~ 30~ 40~ 50~ 60~ 合计
人口数 589452 654935 432567 123794 31129 1831877
肿瘤患者数
19 194 503 536 261 1513
构成比% 1.3 12.8 33.2 35.4 17.3 100.0
患病率(1/万)
0.32 2.96 11.63 43.30 83.84 8.26
样本数A
0 0 2 2 9 12
男婴数X
6 7 8 9 10
样本数A 12 9 3 1 0
正常 340 73 97 3 513
冠心病诊断 可疑 11 13 18 2 44
冠心病 6 6 18 1 31
合计 357 92 133 6 588
14、调查200名宫颈癌患者,99%都已结婚,能否据此说结婚是宫颈癌的原因之一? 15、某医师为研究肿瘤死亡与年龄的关系,收集了以下数据:
某地、某年肿瘤死亡资料
年龄(岁)
0~ 20~
人口数 82920 46639
死亡总数 138 63
32
肿瘤死亡数
4 12
构成比% 2.9 19.0
40~ 60~ 合计
28161 9370 167090
172 342 715
42 32 90
24.4 9.4 12.6
根据表中资料,各年龄组相比较,哪些说法是对的? (1)“40~”组的人最容易死于肿瘤,“60~”组次之; (2)“40~”组的人最容易死于肿瘤,“20~”组次之; (3)因肿瘤而死亡者中“40~”组的最多。
16、为了研究用两种不同剂量的电离辐射照射小鼠的致死作用是否相同,某研究员以第一种剂量照射25只小鼠,14天内死亡14只;第二种剂量照射18只,同期内死亡5只。问这两种剂量对小鼠的致死作用是否相同?
练习题解答:
一、最佳选择题解答
1、D 2、C 3、C 4、B 5、D 6、A 7、C 8、C 9、E 10、A 11、A 12、B 三、计算分析题解答
1、Pearson χ2检验SPSS主要输出结果:
Chi-Square Tests Asymp. Sig. Pearson Chi-Square Continuity Correction(a) Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases a Computed only for a 2x2 table
b 0 cells (.0%) have expected count less than 5. The minimum expected count is 13.75.
Value 5.236(b) 4.286 5.217 5.182 96 df 1 1 1 1 (2-sided) .022 .038 .022 .023 Exact Sig. (2-sided) .030 Exact Sig. (1-sided) .019
2、Pearson χ2检验SPSS主要输出结果:
Chi-Square Tests Asymp. Sig. Value df (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided) 33
Pearson Chi-Square Continuity Correction(a) Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases a Computed only for a 2x2 table
27.494(b) 25.560 28.627 27.259 117 1 1 1 1 .000 .000 .000 .000 .000 .000 b 0 cells (.0%) have expected count less than 5. The minimum expected count is 23.03.
3、Pearson χ2检验SPSS主要输出结果:
Chi-Square Tests Asymp. Sig. Pearson Chi-Square Continuity Correction(a) Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases a Computed only for a 2x2 table
b 1 cells (25.0%) have expected count less than 5. The minimum expected count is 4.77.
Value 4.739(b) 3.387 4.779 4.660 60 df 1 1 1 1 (2-sided) .029 .066 .029 .031 Exact Sig. (2-sided) .044 Exact Sig. (1-sided) .033 4、Pearson χ2检验SPSS主要输出结果:
Chi-Square Tests Asymp. Sig. Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases Value 60.227(a) 66.745 52.526 1184 df 2 2 1 (2-sided) .000 .000 .000 a 0 cells (.0%) have expected count less than 5. The minimum expected count is 48.75.
三种疗法治疗腰椎间盘突出有效率的比较
疗法 快速牵引法 物理疗法 合计
有效 444 323 767
无效 30 91 121
34
合计 474 414 888
χ2 45.997
P <0.00227
快速牵引法 骶裂孔药物注射法 合计 物理疗法 骶裂孔药物注射法 合计
444 222 666 323 222 545
30 74 104 91 74 165
474 296 770 414 296 710
0.882
>0.0125
54.373
<0.00227
5、Pearson χ2检验SPSS主要输出结果:
Chi-Square Tests Asymp. Sig. Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases Value 17.907(a) 18.755 14.315 84 df 2 2 1 (2-sided) .000 .000 .000 a 0 cells (.0%) have expected count less than 5. The minimum expected count is 5.24.
某省三个地区花生的黄曲霉B1污染率比较
地区 甲 乙 合计 甲 丙 合计 乙 丙 合计
6、χ2=6.37(Pearson χ2检验SPSS输出结果略) 7、χ2=0.35(Pearson χ2检验SPSS输出结果略)
8、Pearson χ2检验SPSS主要输出结果:
Chi-Square Tests(d) Asymp. Sig. Pearson Chi-Square Value .786(b) df 1 (2-sided) .375 Exact Sig. (2-sided) .659 Exact Sig. (1-sided) .330 Point Probability 未污染 6 30 36 6 8 14 30 8 38
污染 23 14 37 23 3 26 14 3 17
合计 29 44 73 29 11 40 44 11 55
χ2 15.773
P <0.00227
7.343 <0.00714
0.005 >0.0125
35
Continuity Correction(a) Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases
a Computed only for a 2x2 table
.196 .792
.750(c)
22
1 1 1 .658 .373
.386
.659 .659 .659
.330 .330 .330
.238
b 2 cells (50.0%) have expected count less than 5. The minimum expected count is 4.00. c The standardized statistic is -.866.
d For 2x2 crosstabulation, exact results are provided instead of Monte Carlo results.
上表中应选择Fisher确切概率法检验结果P=0.659。 9、编制四格表如下:
两组血友病患者死亡率的比较
组别
AL血浆诱导率≤0.7 AL血浆诱导率>0.7
合计
Pearson χ2检验SPSS主要输出结果:
Chi-Square Tests Asymp. Sig. Pearson Chi-Square Continuity Correction(a) Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases a Computed only for a 2x2 table
b 4 cells (100.0%) have expected count less than 5. The minimum expected count is 2.50. c The standardized statistic is 2.687.
Value 7.778(b) 4.978 9.873 7.222(c) 14 df 1 1 1 1 (2-sided) .005 .026 .002 .007 Exact Sig. (2-sided) .021 .021 .021 .021 Exact Sig. (1-sided) .010 .010 .010 .010 Point Probability .010 死亡 5 2 7
存活 0 7 7
合计 5 9 14
上表中应选择Fisher确切概率法检验结果P=0.021。 10、χ2=1.84(Pearson χ2检验SPSS输出结果略)
直线相关和回归
一. 是非题
1.回归系数越大,两变量的数量关系越密切。( )
2.双变量正态分布资料,样本回归系数小于0,可认为两变量呈负相关。( ) 3.样本相关系数r=0.8,就可以认为两变量相关非常密切。( )
36
4.建立了回归方程,且回归系数b有统计意义,就可认为两变量间存在因果关系。
5.对于双变量正态分布资料,同一样本的相关系数及回归系数与0的差别的统计检验结论一致。( ) 二.选择题
1.同样性质研究工作的两组资料中,回归系数b1>b2时,第1组______。 A.样本相关系数r也较大
B.资料X的变化引起的Y变化幅度比第2组大 C.对样本回归系数作检验的t值也较大
D.资料中X的变化引起的Y变化(幅度)是否大于第2组还不一定 2.对样本相关系数作统计检验,结果r > r0. 05(ν),统计结论是 。 A.肯定两变量为直线关系 B.认为两变量有线性关系 C.两变量不相关 D.两变量无线性相关 3.若r1 > r0. 05(ν),则可认为 。 , r2 > r0. 01(ν)
A.第一组资料两变量关系密切 B.第二组资料两变量关系密切
C.难说哪一组资料中两变量关系更密切 D.两组资料中两变量关系密切程度不一样 4.若对样本回归系数作统计检验,P<0.05,则可认为 。 A.两变量间不存在回归关系 B.两变量间存在线性回归关系 C.两变量间不会是曲线关系 D.两变量间无线性相关 5.相关分析可以用于 有无关系的研究。 A.性别与体重 B.肺活量与胸围 C.职业与血型 D.国籍与智商 6.对X、Y两个变量作直线回归分析的条件之一是______。
A.要求X、Y呈双变量正态分布 B.只要求X服从等方差正态分布 C.只要求Y服从等方差正态分布 D.只要求X、Y是定量变量 7._______,回归方程拟合得愈好。
A.回归系数愈大 B.回归系数愈小
C.决定系数愈大 D.回归系数愈大,决定系数愈小 8.直线回归方程不能用于______
A.描述两个变量间的数量关系 B.对应变量Y进行预测
C.对应变量Y的控制提供信息 D.表示两个变量间关系的密切程度 9.如果直线相关系数r=1,则一定有_____
A.SS总=SS残 B.SS残=SS回 C.SS总=SS回 D.SS总> SS回
10.直线回归中,如果自变量X乘以一个不为0或1的常数,则有_____
A.截距改变 B.回归系数改变 C.两者都改变 D.两者都不改变
11.某环保科用甲乙两种方法同时测定污染水中溶解氧含量,在建立以容易测定的甲法结果推算乙法测定值的直线回归方程前,应首先_____
A.画出标准曲线 B.计算测定结果的均数
37
C.以测定值绘制散点图 D.以测定值输入计算机进行指标计算
12.某省调查了2万名高血压患者收缩压Y(kPa)与吸烟量X(支/日)情况,拟合直线回归方程
??12+0.004x,相关系数r=0.356 P<0.01,r2=0.1253,可认为______ yA.吸烟是导致收缩压增高的一个原因 B.收缩压增高是由于吸烟而引起的
C.收缩压高低与吸烟量大小密切相关 D.收缩压总变异中有12.53%可由吸烟量变化来解释
三、简答题
1.相关系数和回归系数的联系和区别? 2.直线回归分析时怎样确定自变量和因变量?
3.试总结从样本数据判断总体回归系数是否成立的统计方法有哪些?
4.某医师将|r|划分为三个等级0~,0.3~,0.7~分别表示低、中、高度相关,你是否同意这种划分,为什么?
四、分析计算题
1.某医师欲研究污染源距离与尘氟浓度的数量关系,测得离污染源距离与尘氟浓度数据见下表,请分析两者存在什么数量关系?
离污染源距离
(m) 尘氟浓度 (0.01 mg/m3)
2.某单位研究代乳粉营养价值时,用大白鼠作实验,得到大白鼠进食量(g)和增加体重(g)的数据如下:
鼠号 进食量(g) 体重增加(g)
1 800 185
2 780 158
3 720 130
4 867 180
5 690 134
6 787 167
7 934 186
8 750 133
4.5
3.7
3.2
2.4
2.0
1.5
1.2
0.7
200
300
400
500
600
700
800
1000
(1)此资料有无可疑的异常点?
(2)求直线回归方程并对回归系数作假设检验。
(3)试估计进食量为900g时,大白鼠的体重平均增加多少,计算其95%的可信区间,并说明其含义。 (4)求进食量为900g时,个体Y值得95%允许区间,并解释其意义。 3.10例糖尿病病人血糖(mmol/L)与胰岛素水平(mu/L)的测定值如下表。
病例号 血糖Y 胰岛素X
1
2
3 7.88 19.8
4
5
6 6.44 25.1
7 10.16 22.0
8 8.49 23.2
9
10
12.21 12.27 15.2
11.9
10.43 19.59 17.0
5.9
11.38 12.49 16.8
13.7
(1)试以血糖为应变量Y,胰岛素为自变量X建立回归方程,并对回归方程进行假设检验。(2)现已知一糖尿病病人胰岛素水平为15(mu/L),试预测其血糖水平。(α=0.05)
(3)预将病人血糖水平控制在正常范围的上界,即6.66mmol/L以内时,血中胰岛素应维持在什么水平
38
上?(α=0.05)
4.某人研究以纸箱装的安瓿在空运后的损坏情况,某一种用于医学研究的药品,每次空运一纸箱(1000安瓿),下表三是10次运输后破损记录,其中X表示运输过程中纸箱转换飞机的次数,Y表示空运到达目的地后安瓿破损数量,假设一元线性回归方程是适用的。
运次
1
2
3 7.88 19.8
4
5
6 6.44 25.1
7 10.16 22.0
8 8.49 23.2
9
10
X Y
12.21 12.27 15.2
11.9
10.43 19.59 17.0
5.9
11.38 12.49 16.8
13.7
(1)求回归方程。并分析拟合线性回归方程好吗? (2)当转换次数X=1时,求安瓿破损期数的点估计值。
(3)如果纸箱两次转换飞机,估计安瓿破损的期望值比转换一次时增加了多少? (4)验证回归线通过(x,y)。
参考答案
二、选择题
1.D 2.B 3.C 4.B 5.B 6.C 7.C 8.D 9.C 10.B 11.C 12.D 四、分析计算题
1.SPSS主要输出结果如下:
相关分析结果:
Correlations 距离 尘氟浓度 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N 距离 1 . 8 -.979(**) .000 8 尘氟浓度 -.979(**) .000 8 1 . 8 ** Correlation is significant at the 0.01 level (2-tailed).
??5.479?-0.979X(X为离污染源距离,Y为尘氟浓度) 求得直线方程Y经假设检验可以认为离污染源距离与尘氟浓度有直线关系。 2. SPSS主要输出结果 散点图: 相关分析结果:
Correlations 进食量
Pearson Correlation Sig. (2-tailed) N 进食量 1 . 8 39
体重增加 .854(**) .007 8 体重增加 Pearson Correlation Sig. (2-tailed) N .854(**) .007 8 1 . 8 ** Correlation is significant at the 0.01 level (2-tailed)
(1)由散点图及回归直线综合分析,点(800,185)可视为异常点。
??0.261?47.353X (2)求得直线方程Y经假设检验可以认为进食量与增重有直线关系。 (3)Y=187.574
???Y?的95%可信区间:(Y-t0.05,6SY?,Y+t0.05,6SY?)=(166.67,208.48)
即估计总体中,进食量为900克,大白鼠平均增加体重在187.574g,95%可信区间(166.67,208.48)。
??(4)Y值的95%的允许区间:(Y-t0.05,6SY,Y+t0.05,6SY)=(148.42,226.73)
即估计总体中,进食量为900克,有95%的大白鼠增加体重在148.42~226.73g。
3. SPSS主要输出结果 散点图: 相关分析结果:
Correlations 血糖 胰岛素 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N 血糖 1 . 10 -.931(**) .000 10 胰岛素 -.931(**) .000 10 1 . 10 ** Correlation is significant at the 0.01 level (2-tailed).
??21.05?0.58X。 (1)回归方程 :Y(2)95%可信限:(8.95,15.72)。 (3)应控制胰岛素X≥30.34(mu/L)。
4.SPSS主要输出结果 散点图: 相关分析结果:
Correlations 换机次数
Pearson Correlation Sig. (2-tailed) N 换机次数 1 . 10 40
破损数量 -.931(**) .000 10 破损数量
Pearson Correlation Sig. (2-tailed) N
-.931(**)
.000 10
1 . 10
** Correlation is significant at the 0.01 level (2-tailed).
??10.2?4.0X,回归方程拟合得较好,决定系数r=0.9。 (1)回归方程:Y2
?=14.2。 (2)当转换次数X=1时,Y(3)如果纸箱两次转换飞机,估计安瓿破损的期望值比转换一次时增加了4个。
秩和检验
一、是非题
(1)非参数统计方法不对特定分布的参数作统计推断,也不要求数据服从正态分布。( ) (2)正态分布资料也可以用非参数统计方法作分析,但平均统计效能偏低。( ) (3)两组资料比较时,秩和检验和t检验的无效假设是一样的。( )
(4)成组设计两样本比较秩和检验(Wilcoxon法)中的编秩是两个样本分别进行的。( ) (5)完全随机设计资料秩和检验(Kruskal-Wallis法),当相同秩次比较多时,需计算校正H值,计算公式为Hc=H/C,其中C值必介于0与1之间。( )
41
二、选择题:1、4组病人疗效(优、良、中、差)比较,宜用 。
A 方差分析 B秩和检验 C 卡方检验 D 四格表直接计算概率法 2、两样本秩和检验的无效假设是 。
A 两样本秩和相等 B 两总体分布相同 C 两样本分布相同 D 两总体秩和相等 3、 ,应该用非参数统计方法。 A正态分布资料n不相等时两样本均数比较
B 正态分布资料两样本方差都比较大时两样本均数的比较 C 两组等级资料的比较
D 两组百分比资料的平均数比较
4、在统计检验中是否选择用非参数统计方法, 。 A 要根据研究目的和数据特征作决定
B 可在算出几个统计量和得出初步结论后进行选择 C要看哪个统计结论符合专业理论 D 要看哪个P值更小
5、下表列出了成组设计的两样本资料及甲乙两个研究者的编秩结果,下面哪一个说法是对的?
A 甲的编秩方法是错的 B 乙的编秩方法是错的 C 甲乙两人的编秩方法均对 D 甲乙两人的编秩方法均错
成组设计的两样本资料及甲乙研究者的编秩结果 实验组 对照组 甲的编秩 乙的编秩 实测值 甲的编秩 乙的编秩 7.5 7.5 10 7.5 7.5 9 9 4 5 8 10 10.5 8 5 5
11 10.5 6 1 2 12 13 2 2 6 13 13 6 3 2 14 13 8 6 5 17 17 19 17 17 17 17 20 20 20.5 17 17 20 21 20.5 17 17 21 22 22
实测值 10 12 15 15 17 17 17 19 19 19 19 6、以下检验方法中,_______不属于非参数统计方法。
A.t检验 B.H检验 C.T检验 D.χ2检验
7、为判断各总体均数是否相等,对于来自方差齐性及正态分布总体的多个样本比较,可以作秩和(H)检验,通过判断各总体分布的位置是否相同而判断各总体均数是否相等,与作方差分析相比______。 A.应该把α定得小一点 B.将增大犯I类错误的概率 C.将增大犯II类错误的概率 D.将同时增大犯两类错误的概率
8、通过随机抽样分析两种对象头发中某种金属元素含量是否有高低,若不符合t检验的条件,并无法通过数据转换改善正态性和方差齐性,则______。
42
A.可考虑改用方差分析
B.可考虑用两样本比较的秩和检验(T)检验或多样本比较的秩和(H)检验 C.可考虑用两样本比较的秩和检验,但不能用多样本比较的秩和检验 D.秩和检验与方差分析均不能用
9、配对比较的秩和检验,若检验假设H0成立,则______。
A.差值为正的秩和与差值为负的秩和相差不会太大 B.正秩和的绝对值大于负秩和的绝对值 C.正秩和的绝对值小于负秩和的绝对值 D.正秩和与负秩和相等 10、多个样本比较秩和检验结果P<0.05,则统计结论是______。 A.多个总体均数全不相等 B.多个总体均数不全相等 C.这些样本所属总体都不相同 D.这些样本并非来自相同总体
三、简答题
1、参数检验和非参数检验的区别何在?各有何优缺点?
2、对同一资料,又出自同一研究目的,用参数检验和非参数检验所得结果不一致时,宜以何者为准? 3、为什么秩和检验的编秩在不同对比组间出现相同数据要给予“平均秩次”,而同一组的相同数据可不必计算“平均秩次”?
四、计算分析题
1、配对比较两种方法治疗扁平足效果记录如下表,请选择合适的方法进行分析。 病例号 甲法 乙法
2、下表资料是10名健康人用离子交换法与蒸馏法测定尿汞值的结果,问两法测定结果有无差别?
编号 离子交换法 蒸馏法
3、以下是测得的铅作业与非铅作业工人的血铅值(μmol/L),请问两组工人的血铅值有无差别?
编号 铅作业组 非铅作业组
4、试分析针刺不同穴位的镇痛效果有无差别?
镇痛效果
各穴位的观察频数
1 0.82 0.24
2 0.87 0.24
3 0.97 0.29
4 1.21 0.33
5 1.64 0.44
6 2.08 0.58
7 2.13 0.63
8 0.72
9 0.87
10 1.01
1 0.5 0.0
2 2.2 1.1
3 0.0 0.0
4 2.3 1.3
5 6.2 3.4
6 1.0 4.6
7 1.8 1.1
8 4.4 4.6
9 2.7 3.4
10 1.3 2.1
1 好 差
2 好 好
3 好 差
4 好 中
5 差 中
6 中 差
7 好 中
8 好 差
9 中 中
10 差 差
11 好 好
12 差 差
13 好 中
14 中 差
15 好 中
16 中 差
43
合谷
+ ++ +++ ++++
38 44 12 24
足三里 53 29 28 16
扶突 47 23 19 33
5、在研究某地方病的病因工作中,用病区的粮食作动物实验。今有两组大白鼠,分别用甲乙两种饲料配方饲养,观察大白鼠的心肌坏死面积(小格数)如下表,问两组间的坏死面积有无差别?(本资料用t检验和秩和检验何者为好?为什么?) 甲组(n1=29) 0(10)
4.3
0.2 5.1
0.3 5.4 0.3
0.4(2) 5.5
0.6 6.1
1.0 6.2
1.6 9.7 1.7
2.2 13.8 2.8
2.6 36 7.4
3.3 13.0
乙组(n2=28) 0(15) 0.2(3)
0.4(2) 0.9(2) 1.3
参考答案
二、选择题
1.B 2.B 3.C 4.A 5.C 6.A 7.C 8.B 9.D 10.D 四、计算分析题
1、解:可采用配对秩和检验(好中差分别赋值1、2、3) P<0.01,可以认为甲法疗效优于乙法。
2、解:尿汞值据经验不符合正态分布,采用Wilcoxon符号秩检验。 P>0.1,尚不能认为两法测定尿汞值的结果有差别。 3、解:对资料作两组比较的秩和检验。
P<0.01,可以认为铅作业工人和非铅作业工人血铅值有差异。 4、解:采用等级资料多组比较的秩和检验(相同秩次较多,需较正) P>0.05,不拒绝H0。
5、解:应用t检验的条件是所分析的数据来自正态总体,而且要求相应的两总体方差齐,但两组样本分别为29例、28例,不宜编制频数表来推断总体的正态性。但经过两样本的方差齐性检验知方差不齐,应该用秩和检验方法。 P<0.05
44