前两章 没什么特别重要的知识但不要放松必拿分数。
9
第三章集中量数(2-3选择)
数据的集中趋势就是指数据分布中大连数据朝向某个方向集中的程度,用于描述数据集中程度的统计量。
第一节 算书平均数 一 概念及计算公式 1概念
算术平均数,是所有观测值(或变量)的总和除以总数所得得商。 符号:X或M
2计算公式
公式一 (平均数的定义公式)
?X?—?XNi
公式二 (平均数的估算公式)
X?X?AM?—'N AM 估算值
例题
现有一组实验观测数据,25 27 28 27 25 29 30 34 32 33.计算他们的平均数。 解法一:
根据题意已知N=10,根据公式:
解法二:
先设定一个估计平均数AM=27,求x=Xi-A的值。 Xi 25 27 28 27 25 29 30 34 32 X -2 0 1 0 -2 2 3 7 5
先估计 平均值为27(预估计)(大的数据用估计法好算 有利于简化 计算过程)
10
二 平均数的特点
1 一组变量值的和等于变量的个数与平均数的乘积,
?X?NX
2 一组变量值的离均差之和等于零,(说明了平均数是一组数据的重心 最能表达一 组数据的集中趋势)
—(X?X)?0 ? 3 在一组变量中,每个变量值加上或减去、乘以或除以常数c,所得的平均数等于 原平均数加上或减去、乘以或除以常数c。
三 平均数的意义
1平均数是应用最普遍的一种集中量数。
2 是真值渐进、最佳的估计值。(概率分布中心极限定理)(真值=μ总体平均数) 3 当观测次数无限增加时,算术平均数趋近于真值。 (样本平均数量趋近于总体平均数)
(观测次数较少时 样本统计量是总体参数的无偏估计) 四 平均数的优缺点(选择题的重要内容)
1 优点:反应灵敏;计算严密;计算简单;内容容易理解;适合进一步代数运算、 较少受抽样变动的影响。
2 缺点:容易受极端数据的影响;如果出现模糊不清的数据,无法使用。
第二节 中数与众数 一 中数
中数又称中位数,间称中数用Md表示,是按一定顺序排列的一组数中央位置的数值。 中数是一种位置量数。
中数的计算(主要考中数的计算方式) 1 中数附近无重复数时
若数据个数(N)奇数时,中数则为(N+1)/2位置的那个数。 若数据个数(N)偶数时,中数则为居于中间两个数的平均数
—??XX/2 N/2?N/2?1 2 中数附近有重复数时(难点 没考过 考很正常)采用画图法(王老师开创) 例:求11 11 11 11 13 13 13 17 17
分析:N=9 中间位置为5,第5个数为13。但数据中有3个13,意味着3个13占 了一个单位。(统计学上把13看为一个区间,三个13共享这个区间,把区 间划分为三段,
12.5+1/6 第一小段的组中值
11
二 众数 1 含义:
众数(mode)是指一群数据中出现次数最多的那个数,不只有一个,用Mo表 示。 2计算方法:
(1) 直接观察法
未分组数据---次数最多的数值
次数分布表---次数最多一组的组中值 (2) 公式计算法
皮尔逊经验公式:(牢记)
XO?3Md?2X
三 平均数 中数 众数三者间的关系(出小了计算形式为主的选择题 出大了简答题)
1 正态分布 Md?MO?X 2 偏态分布 XO?3Md?2X
—?—
左偏分布=负偏态 右偏分布=正偏态(比较三数大小直接画图即可直观看出)
第三节 其他集中数(往往没怎么考过)(统计中基本不考) 一 加权平均数
是观测数据(Xi)与相应的权数(W)乘积的和除以总权数(W1?W2?W3?........?Wn) 所得的商。用符号Mw表示。
权数是指各变量在构成总体重的相对重要性,权数的大小,由观测者依据一定的理论 或经验而定。
MnW1X1?W2X2?.....?WnXn
W1?W2?........?Wn 每个数对总体的贡献不一样 权重不一样 二 几何平均数
三 调和平均数:先将各个数据取倒数平均,然后再取倒数,表述符号为MH,主要用于 描述速度方面的集中趋势。
12