《医学统计学》复习资料与习题答案

e. 报告结论时注意应列出检验统计量值, 注明采用的是单侧或双侧检验, 写出P值确切范围。

( 四 )计数资料的分析

1、常用相对数: 分析计数资料的指标。 ( 1 ) 率: 表示某种现象发生的频度或强度。

率= 某现象实际发生例数/可能发生该现象的总例数 ? 比例基数( 习惯上以计算的率保留1 - 2位整数)

( 2 ) 构成比: 说明事物内部各组成部分所占的比重或分布。

构成比= 某一组成部分的观察单位数/同一事物各组成部分的观察单位总数 ?100% ( 3 ) 相对比: 两个有关指标之比, 用以表示两个指标之间的对比关系。 2、应用相对数时应注意的问题 (1) 计算相对数的分母不宜太小; (2) 分析时不能以构成比代替率;

(3) 对观察单位数不等的几个率, 不能直接相加就其平均率; (4) 资料的对比应注意可比性: a.观察对象同质; b.内部构成相同。 (5) 对样本率( 或构成比 )的比较应遵循随机抽样, 要作假设检验。 3、标准化法

(1) 概念: 即采用一个共同的内部构成标准, 使两个样本或多个样本的不同内部构成调整为共同的内部构成标准, 以消除因内部构成不同对样本率的影响。标准化后的率叫标准化率。 (2) 计算方法: 直接法、间接法。

(3) 注意事项: a. 选定标准不同, 算得的标准化率也不同, 因此不能代表实际水平; b. 各组间若出现明显交叉, 不宜用标准化法; c. 两样本标化率的比较应作假设检验。 4、常用相对数指标

(1) 出生率=某年活产数/同年平均人口数 ? 1000% (2) 死亡率=某年死亡总数/同年平均人口数 ? 1000%

(3) 发病率=某人群某时期内新病例数/某人群同期平均人口数 ? K (4) 某病患病率=观察时点某病例数/同时点检查人数 ? K (5) 某病感染率=受检者感染某病原体人数/受检人数 ? K (6) 治愈率= 治愈病人数/接受治疗人数 ? 100%

(7) 某病病死率=某期间因某病死亡人数/同期该病患者 ? 100% (8) 生存率=n年末存活的病例数/随访满n年的病例数 ? 100% 5、率的抽样误差和率的标准误

(1) 概念: 由抽样造成的样本率与总体率的差别叫率的抽样误差。衡量率的抽样误差大小, 衡量样本率的稳定性的指标, 即率的标准误。

30

(2) 率的标准误的计算

?P =??( 1 - ? )/n SP =?P( 1 - P )/n (3) 总体率的区间估计

a. 查表法: n较小, 特别是p接近0或1时

b.正态近似法: n足够大, 样本率p和(1 - p)均不太小, 如np与n( 1 - p )均大于5时 ( p - u? SP , p + u? SP ) 6、计数资料的假设检验----U检验

(1) 条件: n足够大, 样本率p和(1 - p)均不太小, 如np与n( 1 - p )均大于5时, 样本率的分布呈正态分布。 (2) 样本率与总体率的比较

H0: ? = ?0 u =? p - ??/ ?P (3) 两样本率比较的u检验

H0: ?1 = ?0 u =? p1 - p2?/ SP1 - P2 7、计数资料的假设检验-----?检验 (1) 用途

常用于检验两个样本率(或构成比)之间的差异显著性, 也可用于检验多个样本率之间的差异显著性, 还可用于检验配对计数资料的差异显著性。 (2) 基本思想

? = ?( A - T)/T T = nRnC/n ?反映了实际频数与理论频数的吻合程度。 ?的大小取决于A - T的差值, 还取决于自由度?。 ? = ( 行数- 1 )( 列数- 1 ) (3) 四格表资料的?检验( 两样本率比较 ) 统计量的计算可用专用公式或基本公式 a. 基本条件: n > 40, T > 1 b. 校正条件: n > 40, 5 > T > 1

(4) 行 ? 列表的?检验( 多个样本率或构成比的比较) a. ?值的计算: ? = n( A/nRnC - 1 )

2

2

2

2

22

222

2

2

b. 注意事项: ?检验要求理论频数不宜太小, 一般认为不宜有1/5以上格子理论数小于5, 或有一个理论数小于1, 处理办法有: 增大一般含量, 最好; 删去理论频数太小的行或列; 合并性质相近的行或列。等级资料宜用秩和检验。当结论为拒绝检验假设, 只能认为各总体率( 或总体构成比 )之间总的来说有差别, 但不能说明它们彼此之间都有差别。 (5) 配对计数资料的?检验 a. H0 : b = c

b. ?=( b - c )/ b + c

31

2

2

2

c. b + c < 40, 需校正, ? =( ?b - c? - 1)/b + c d. ? = 1 (五) 统计表与统计图 1、统计表

(1) 基本结构与要求: 由标题、标目、线条、数字等组成

a. 标题: 要求中心内容突出, 必要时注明资料的时间、地点。 b. 标目: 横标目: 在表的左侧, 是表的主语位置。 纵标目: 在表的上方, 是表的谓语位置。

c. 线条: 分顶线、底线、纵标目下面与合计上面的横线,斜线、竖线省略。 d. 数字: 一律用阿拉伯数字。

e. 备注: 列于表的下面, 对表中标有 ( ?)的数字加以描述。 (2) 种类

a. 简单表: 被研究的事物只按一个特征或指标分组。

b. 复合表: 被研究的事物按两个或两个以上相关联的特征或指标分组。 2、统计图

(1) 基本要求: a. 依据资料的性质选择适当的图形;

b. 要有标题, 扼要说明资料的内容, 必要时注明时间、地点;

c. 以纵轴和横轴为坐标的图形, 横轴尺度自左而右, 纵轴尺度自下而上, 数 量一律由小到大, 并需等距标明。纵横坐标长度的比例一般为5? 7。 d. 比较不同事物时, 用不同的线条或颜色表示, 要附图例说明。 3、常用统计图

(1) 直条图: 用相同宽度条形的长短.来表示资料数值大小比例关系, 适用于按性质分组, 各个独立的、无连续关系的统计图。 (2) 百分条图: 适用于表达构成比的资料。

(3) 线图: 用线条的上升和下降来表示某事物( 或某现象 )因时间或条件而变化的趋势。 适用于连续性的变量资料。

(4) 直方图: 用于表示连续变量的频数分布。常以横轴表示被观察现象, 纵轴表示频数或 频率, 以各矩形( 宽度为组距 )的面积代表各组段的频数。 (六) 调查设计 1、调查方法

(1) 普查( 全面调查 ): 将组成总体的所有观察单位全部加一调查。

(2) 抽样调查: 从总体中随机抽取一定数量的观察单位组成样本, 然后用样本信息来推断 总体特征。

(3) 典型调查( 案例调查 ): 即在对事物作全面分析的基础上, 有目的地选定典型的人、典 型的单位进行调查。

32

22

2、调查项目和调查表

(1) 分析项目: 直接用于计算调处指标, 以及分析时排除混杂因素影响所必须得分内容。 (2) 备查项目: 便于核查、补填和更正而设置的, 通常不直接用于分析。 (3) 调查表的格式: 分为一览表和单一表。 (4) 随机抽样的方法: a. 单纯随机抽样; b. 系统抽样; c. 整群抽样; d. 分层抽样;

根据抽样误差的大小, 分层抽样 < 系统抽样 < 单纯随机抽样 < 整群抽样

第十章 线性相关与回归

(Linear Correlation & Regression ) 线性相关与回归 第一节 线性相关

第二节 线性回归

第三节 线性相关与回归的区别和联系

第三节 等级相关

线性相关(linear correlation) 一、线性相关的基本概念 二、线性相关系数 三、相关系数的显著性检验 四、进行线性相关分析的注意事项 一、线性相关的基本概念

为直观地判断两个变量之间的关系,可在直角坐标系中把每对(Xi,Yi)值所代表的点绘出来,形成散点图。

若一个变量X由小到大(或由大到小),另一变量Y亦相应地由小到大或由大到小,则两个 变量的散点图呈直线趋势,我们称这种现象为共变,也就是这两个变量之间有“相关关系”。 男青年身高与前臂长散点呈直线趋势,即男青年身材高,前臂亦长,说明身高与前臂长之间存在线性相关关系我们把这种关系称为直线相关。

线性相关用于双变量正态资料。它的性质可由散点图直观地说明。散点图中点的分布即线性相关的性质和相关之间的密切程度,可分为以下几种情况:

33

联系客服:779662525#qq.com(#替换为@)