do i=1 to 13; input y @@; input n @@; do j=1 to n; output; end; end; cards; 2.1 390 2.3 1434 2.5 2643 2.7 3546 2.9 5692 3.1 5187 3.3 4333 3.5 2767 3.7 1677 3.9 1137 4.1 667 4.3 346 4.5 181 ; run;
proc means n skewness kurtosis; var y; run;
The SAS System Analysis Variable : Y
n Skewness Kurtosis
--------------------------------- 30000 0.4106458 0.0587006
---------------------------------
样本含量n=30000,是一个很大的样本,样本的偏斜度和峭度都已经很可靠了。偏斜度为0.41,有一个明显的正偏。
1.14 马边河贝氏高原鳅繁殖群体体重分布如下[5]:
体质量/g
中值
雌 鱼
雄 鱼
2.00~3.00 3.00~4.00 4.00~5.00 5.00~6.00 6.00~7.00
7.00~8.00 8.00~9.00 9.00~10.0
2.50 3.50 4.50 5.50 6.50 7.50 8.50 9.50 10.50 11.50
12.50
1 6 13 30 25 16 21 18 12 3
2
4 7 11 25 25 23 17 16 4
0
10.00~11.00
11.00~12.00
12.00~13.00
首先判断数据的类型,然后分别绘制雌鱼和雄鱼的频数分布图,计算样本平均数、标准差、偏斜度和峭度并比较两者的变异程度。
答:鱼的体重为度量数据,表中第一列所给出的数值为组限。在下面的分布图中雌鱼和雄鱼的分布绘在了同一张图上,以不同的颜色表示。
计算统计量的SAS程序与前面的例题类似,这里不再给出,只给出结果。
雌鱼:
The SAS System
Analysis Variable : Y
N Mean Std Dev Skewness Kurtosis
-----------------------------------------------------------
147 7.2414966 2.1456820 0.2318337 -0.6758677
-----------------------------------------------------------
雄鱼:
The SAS System
Analysis Variable : Y
N Mean Std Dev Skewness Kurtosis
-----------------------------------------------------------
132 6.7803030 1.9233971 -0.1322816 -0.5510332
-----------------------------------------------------------
直观地看,雄鱼的平均体重低于雌鱼。雌鱼有一正偏,雄鱼有一负偏。因此,相对来说雌鱼低体重者较多,雄鱼高体重者较多。但两者都有很明显的负峭度,说明“曲线”较平坦,两尾翘得较高。
1.15 黄胸鼠体重的频数分布[6]:
组 界/g
0 y75<≤90 90 y150<≤165 总 数 频 数 10 26 30 22 22 17 16 14 6 4 2 169 绘制频数分布图,从图形上看分布是对称的吗,说明什么问题? 答:下面是频数分布图: 从上图可见,图形不是对称的,有一些正偏。说明在该黄雄鼠群体中,低体重者分布数量,高于高体重者的数量。另外,似乎峭度也有些低。 1.16 25名患者入院后最初的白细胞数量(×103)[7] 如下表: 6 9 8 6 7 6 8 5 12 4 11 7 3 11 14 11 10 14 4 5 5 7 12 5 6 计算白细胞数量的平均数、方差和标准差。 答:用means过程计算,程序不再给出,只给出运行结果。 Dev The SAS System Analysis Variable : Y N Mean Variance Std ------------------------------------------- 25 7.8400000 10.3066667 3.2103998 -------------------------------------------- 1.17 细胞珠蛋白基因(CYGB)可能是非小细胞肺癌(NSCLC)的抑制基因之一。一个研究小组研究了该基因的表达、启动子甲基化和等位基因不平衡状态等,以便发现它与肿瘤发病间的关联。下面列出了其中15名患者的基因表达(肿瘤患者/正常对照,T/N),肿瘤患者与正常对照甲基化指数差(MtIT-MtIN)[8]: 样本号 357 370 367 316 T/N 0.014 0.019 0.035 0.044 MtIT-MtIN 0.419 0.017 0.105 0.333