数据的统计描述和分析实验指导书(matlab版) 下载本文

A =

1 2 3 4 5 2 3 7 0 >> sort(A) ans =

1 2 0 3 5 2 4 7 3 >> [Y,I]=sort(A) Y =

1 2 0 3 5 2 4 7 3 I =

1 1 3 3 2 2 2 3 1 命令 按行方式排序 函数 sortrows

格式 Y=sortrows(A) %A为矩阵,返回矩阵Y,Y按A的第1列由小到大,以

行方式排序后生成的矩阵。

Y=sortrows(A, col) %按指定列col由小到大进行排序

[Y,I]=sortrows(A, col) % Y为排序的结果,I表示Y中第col列元素在A中位置。 说明 若X为复数,则通过|X|的大小排序。 例37

>> A=[1 2 3;4 5 2;3 7 0] A =

1 2 3 4 5 2 3 7 0 >> sortrows(A) ans =

1 2 3 3 7 0 4 5 2 >> sortrows(A,1) ans =

1 2 3 3 7 0 4 5 2 >> sortrows(A,3) ans =

3 7 0 4 5 2 1 2 3

>> sortrows(A,[3 2]) ans =

3 7 0 4 5 2 1 2 3 >> [Y,I]=sortrows(A,3) Y =

3 7 0 4 5 2 1 2 3 I = 3 2 1

命令 求最大值与最小值之差 函数 range

格式 Y=range(X) %X为向量,返回X中的最大值与最小值之差。

Y=range(A) %A为矩阵,返回A中各列元素的最大值与最小值之差。 例38

>> A=[1 2 3;4 5 2;3 7 0] A =

1 2 3 4 5 2 3 7 0 >> Y=range(A) Y =3 5 3 3、期望

命令 计算样本均值 函数 mean

格式 用法与前面一样

例39 随机抽取6个滚珠测得直径如下:(直径:mm) 14.70 15.21 14.90 14.91 15.32 15.32 试求样本平均值

解:>>X=[14.70 15.21 14.90 14.91 15.32 15.32]; >>mean(X) %计算样本均值 则结果如下: ans =15.0600

命令 由分布律计算均值 利用sum函数计算

例40 设随机变量X的分布律为:

X -2 -1 0 1 2 P 0.3 0.1 0.2 0.1 0.3 求E (X) E(X2-1)

解:在Matlab编辑器中建立M文件如下: X=[-2 -1 0 1 2];

p=[0.3 0.1 0.2 0.1 0.3];

EX=sum(X.*p) Y=X.^2-1 EY=sum(Y.*p) 运行后结果如下:

EX = 0;Y = 3 0 -1 0 3;EY = 1.6000 4、方差

命令 求样本方差 函数 var 格式 D=var(X) %var(X)=s2?1 (xi?X)2,若X为向量,则返回向量的样本方差。?n?1i?1n D=var(A) %A为矩阵,则D为A的列向量的样本方差构成的行向量。

D=var(X, 1) %返回向量(矩阵)X的简单方差(即置前因子为1的方差)

nD=var(X, w) %返回向量(矩阵)X的以w为权重的方差 命令 求标准差 函数 std

格式 std(X) %返回向量(矩阵)X的样本标准差(置前因子为

1nxi?X ?n?1i?11)即:

n?1std?std(X,1) %返回向量(矩阵)X的标准差(置前因子为

1) nstd(X, 0) %与std (X)相同

std(X, flag, dim) %返回向量(矩阵)中维数为dim的标准差值,其中flag=0时,

置前因子为1;否则置前因子为1。

nn?1

例4-41 求下列样本的样本方差和样本标准差,方差和标准差

14.70 15.21 14.90 15.32 15.32

解:>>X=[14.7 15.21 14.9 14.91 15.32 15.32]; >>DX=var(X,1) %方差 DX = 0.0559

>>sigma=std(X,1) %标准差 sigma = 0.2364

>>DX1=var(X) %样本方差 DX1 = 0.0671

>>sigma1=std(X) %样本标准差 sigma1 = 0.2590

命令 忽略NaN的标准差 函数 nanstd

格式 y = nanstd(X) %若X为含有元素NaN的向量,则返回除NaN外的元素的标准差,

若X为含元素NaN的矩阵,则返回各列除NaN外的标准差构成的向量。

例42

>> M=magic(3) %产生3阶魔方阵 M =

8 1 6 3 5 7 4 9 2

>> M([1 6 8])=[NaN NaN NaN] %替换3阶魔方阵中第1、6、8个元素为NaN M =

NaN 1 6 3 5 NaN 4 NaN 2

>> y=nanstd(M) %求忽略NaN的各列向量的标准差 y = 0.7071 2.8284 2.8284

>> X=[1 5]; %忽略NaN的第2列元素

>> y2=std(X) %验证第2列忽略NaN元素的标准差 y2 =2.8284

命令 样本的偏斜度 函数 skewness

格式 y = skewness(X) %X为向量,返回X的元素的偏斜度;X为矩阵,返回X各列

元素的偏斜度构成的行向量。

y = skewness(X,flag) %flag=0表示偏斜纠正,flag=1(默认)表示偏斜不纠正。 说明 偏斜度样本数据关于均值不对称的一个测度,如果偏斜度为负,说明均值左边的数据比均值右边的数据更散;如果偏斜度为正,说明均值右边的数据比均值左边的数据更散,

E(x??)3因而正态分布的偏斜度为 0;偏斜度是这样定义的:y?

?3其中:μ为x的均值,σ为x的标准差,E(.)为期望值算子 例43 >> X=randn([5,4]) X =

0.2944 0.8580 -0.3999 0.6686 -1.3362 1.2540 0.6900 1.1908 0.7143 -1.5937 0.8156 -1.2025 1.6236 -1.4410 0.7119 -0.0198 -0.6918 0.5711 1.2902 -0.1567 >> y=skewness(X)

y = -0.0040 -0.3136 -0.8865 -0.2652 >> y=skewness(X,0)

y = -0.0059 -0.4674 -1.3216 -0.3954 5、常见分布的期望和方差

命令 均匀分布(连续)的期望和方差 函数 unifstat

格式 [M,V] = unifstat(A,B) %A、B为标量时,就是区间上均匀分布的期望和方差,

A、B也可为向量或矩阵,则M、V也是向量或矩阵。

例44

>>a = 1:6; b = 2.*a; >>[M,V] = unifstat(a,b)

M =1.5000 3.0000 4.5000 6.0000 7.5000 9.0000 V =0.0833 0.3333 0.7500 1.3333 2.0833 3.0000 命令 正态分布的期望和方差 函数 normstat