数据分析与建模实验指导书 下载本文

9]后求解A.*B、A.\\B和A./B的结果。

2.设f(x,y)= x2+sinxy+2y,在M文件编辑/调试器中创建一个名为wlb_3的M函数文件并保存,在命令窗口中调用M文件,实现输入自变量的值时输出函数值。

实习二 数据统计量及其分布检验

一、实验目的

1.掌握利用MATLAB软件计算基本统计量与数据可视化方法。 2.掌握利用MATLAB软件进行数据正态性检验的方法。 二、实例

1.矩阵A是2008年安徽省各市森林资源情况统计数据,计算各指标均值、中位数以及三均值.

A=[53.93 50.98 15.48 256.00 65.41 44.92 40.38 14.99 211.07 151.14 148.19 145.54 17.10 842.09 677.52 293.86 279.86 28.80 1238.01 1035.67 86.96 74.64 12.91 302.67 299.32 165.62 160.25 16.46 898.76 800.96 17.93 16.37 6.20 151.39 30.17 199.46 158.24 11.90 885.16 591.17 660.36 607.16 34.74 2278.37 1984.36 17.14 13.72 8.10 81.20 36.34 148.52 117.54 12.60 494.38 335.26 77.27 66.69 20.85 279.34 187.92 724.30 640.15 54.00 2446.98 2323.04 36.78 32.10 32.12 137.64 115.10 539.49 458.66 56.86 2277.00 2237.43 598.92 546.67 35.60 2291.09 2099.21 791.50 680.96 77.80 3298.56 325] 资料来源:《安徽省统计年鉴2009》

M=mean(A); % 计算各指标(即各列)均值, MD=median(A); % 计算各指标中位数 SM=[0.25,0.5,0.25]*prctile(A,[25,50,75]); % 计算各指标三均值

[M;MD;SM] % 输出计算结果 %计算结果为 ans =

1.0e+003 *

0.2709 0.2406 0.0269 1.0806 0.9543 0.1485 0.1455 0.0171 0.8421 0.5912 0.2258 0.2050 0.0205 1.0516 0.8344

2.根据2007年华东各地区高校教职工数据计算专任教师、行政人员、教辅人员以及工勤人员占在职教工的百分比,该百分比的极差、四分位极差以及上、下截断点。

地 区 上 海 江 苏 浙 江 安 徽 福 建 江 西 山 东

在职教工 61385 134215 67763 59149 47864 63392 120996

专任教师 35480 88568 45622 40743 31385 45153 81889

行政人员 10282 20172 10960 7278 7712 8179 16342

教辅人员 7842 13371 6798 5763 5034 5495 11614

工勤人员 7781 12104 4383 5365 3733 4565 11151

clear

A=[61385 35480 10282 7842 7781 134215 88568 20172 13371 12104 67763 45622 10960 6798 4383 59149 40743 7278 5763 5365 47864 31385 7712 5034 3733 63392 45153 8179 5495 4565 120996 81889 16342 11614 11151 ];

B=A(:,2:5)./[A(:,1)*ones(1,4)]; % 计算百分比

R=range(B); % 计算百分比极差 R1=iqr(B); % 计算四分位极差 XJ=prctile(B,[25])-1.5*R1; % 计算下截断点 SJ=prctile(B,[75])+1.5*R1; % 计算上截断点 B =

0.5780 0.1675 0.1278 0.1268 0.6599 0.1503 0.0996 0.0902 0.6733 0.1617 0.1003 0.0647 0.6888 0.1230 0.0974 0.0907 0.6557 0.1611 0.1052 0.0780 0.7123 0.1290 0.0867 0.0720 0.6768 0.1351 0.0960 0.0922 R =

0.1343 0.0445 0.0411 0.0621 R1 =

0.0291 0.0311 0.0076 0.0183 XJ =

0.6132 0.0840 0.0849 0.0461 SJ =

0.7294 0.2082 0.1154 0.1192

3.随机生成150个服从标准正态分布随机数,将这些数据作为样本数据,分别作出样本数据的柱形图、直方图、阶梯图、火柴棒图等图形。 clear

x= random('normal',0,1,[1,150]); %产生服从标准正态分布随机数150个

bar(x) %作柱形图

hist(x) stairs(x) stem(x) %作直方图

%作阶梯图

%作火柴棒图

4.生成服从标准正态分布的50个样本点,作出样本的经验分布函数图,并与理论分布函数比较. clear

X=normrnd (0,1,50,1); %生成服从标准正态分布的50个样本点 [h,stats]=cdfplot(X); %作样本的经验分布函数图 hold on

plot(-3:0.01:3, normcdf(-3:0.01:3,0,1),'r') %作理论分布函数图

三、实习题

1.已知样本数据为

1,3,4,2,9,6,7,8,11,2.5,3,10

(1)求该数据的中位数; (2)求该数据的顺序统计量;

(3)写出上述计算的MATLAB实现程序。

2.设X~N(-2,1.5),利用MATLAB完成: (1)画出该分布的概率密度函数曲线; (2)求E(X)和Var(X);

(3)求概率P(X<=-1.5), P(X>0.5), P(<1X<3);

(4)求出该分布的0.05分位数、上侧0.05分位数和双侧0.05分位数; (5)随机生成该分布容量为10的样本。