现代心理与教育统计学课后题完整版 下载本文

第一章 绪论 1. 名词解释

随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量 总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体

次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示

频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的

次数被这一组数据总个数去除。频率通畅用比例或百分数表示

概率:又称机率。或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对

出现的次数,也就是某一事物或某种情况在某一总体中出现的比率 统计量:样本的特征值叫做统计量,又叫做特征值

参 数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标

观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就

是具体数据

2. 何谓心理与教育统计学?学习它有何意义

心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。

3. 选用统计方法有哪几个步骤?

首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的

其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要

第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件

4. 什么叫随机变量?心理与教育科学实验所获得的数据是否属于随机变量

随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量

5. 怎样理解总体、样本与个体?

总体N:据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定

样本n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用n表示,又叫样本容量。特点:①样本容量越大,对总体的代表性越强 ②样本不同,统计方法不同

总体与样本可以相互转化。

个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点 6. 何谓次数、频率及概率

次数f:随机事件在某一类别中出现的数目,又称为频数,用f表示

频率:即相对次数,即某个事件次数被总事件除,用比例、百分数表示

概率P:又称机率或然率,用P表示,指某事件在无限管侧重所能预料的相对出现次数。估计值(后验):几次观测中出现m次,P(A)=m/n 真实值(先验):特殊情况下,直接计算的比值 (结果有限,出现可能性相等) 7. 统计量与参数之间有何区别和关系?

参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标 统计量:样本的特征值叫做统计量,又称特征值 二者关系:参数是一个常数,统计量随样本而变化

参数常用希腊字母表示,统计量用英文字母表示 当试验次数=总体大小时,二者为同一指标

当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值 8. 试举例说明各种数据类型之间的区别?

9. 下述一些数据,哪些是测量数据?哪些是计数数据?其数值意味着什么?

17.0千克 89.85厘米 199.2秒 93.5分是测量数据 17人 25本是计数数据

10. 说明下面符号代表的意义

μ反映总体集中情况的统计指标,即总体平均数或期望值

X反映样本平均数

ρ 表示某一事物两个特性总体之间关系的统计指标,相关系数 r 样本相关系数

σ反映总体分散情况的统计指标标准差 s样本标准差

β表示两个特性中体之间数量关系的回归系数 N n

第二章 统计图表

1. 统计分组应注意哪些问题?

① 分类要正确,以被研究对象的本质为基础 ② 分类标志要明确,要包括所有数据

③ 如删除过失所造成的变异数据,要遵循3σ原则 2. 直条图适合哪种资料?

条形图也叫做直条图,主要用于表示离散型数据资料,即计数资料。 3. 圆形图适合哪种资料

又称饼图,主要用于描述间断性资料,目的是为显示各部分在整体中所占的比重大小,以及各部分之间的比较,显示的资料多以相对数(如百分数)为主

4. 将下列的反应时测定资料编制成次数分布表、累积次数分布表、直方图、次数多边形。

177.5 167.4 116.7 130.9 199.1 198.3 225.0 212.0 180.0 171.0 144.0 138.0 191.0 171.5 147.0 172.0 195.5 190.0 206.7 153.2 217.0 179.2 242.2 212.8 171.0 241.0 176.5 165.4 201.0 145.5 163.0 178.0 162.0 188.1 176.5 172.2 215.0 177.9 180.5 193.0 190.5 167.3 170.5 189.5 180.1 217.0 186.3 180.0 182.5 171.0 147.0 160.5 153.2 157.5 143.5 148.5 146.4 150.5 177.1 200.1 137.5 143.7 179.5 185.5 181.6

最大值242.2 最小值116.7 全距为125.5

N=65 代入公式K=1.87(N-1)2/5=9.8 所以K取10 定组距13 最低组的下限取115

表2-1 次数分布表

分组区间 232~ 219~ 206~ 193~ 180~ 167~ 154~ 141~ 128~ 115~ 合计

组中值(Xc)

238 225 212 199 186 173 160 147 134 121

次数(f)

2 1 6 6 14 16 5 11 3 1 65

表2-2 累加次数分布表

分组区间 232~ 219~ 206~ 193~ 180~ 167~ 154~ 141~ 128~ 115~

向上累加次数

次数(f)

2

1 6 6 14 16 5 11 3 1

实际累加次数(cf)

65

63 62 56 50 36 20 15 4 1

相对累加次

数 1.00 0.97 0.95 0.86 0.77 0.55 0.31 0.23 0.06 0.02

向下累加次数

实际累加次数(cf)

2

3 9 15 29 45 50 61 64 65

相对累加次

数 0.03 0.05 0.14 0.23 0.45 0.69 0.77 0.94 0.98 1.00

频率(P) 0.03 0.02 0.09 0.09 0.22 0.25 0.08 0.17 0.05 0.02 1.00

百分次数(%)

3 2 9 9 22 25 8 17 5 2 100

7. 下面是一项美国高中生打工方式的调查结果。根据这些数据用手工方式和计算方式个制

作一个条形图。并通过自己的体会说明两种制图方式的差别和优缺点

打工方式 看护孩子 商店销售 餐饮服务 其他零工

高二(%)

26.0 7.5 11.5 8.0 高三(%)

5.0 22.0 17.5 1.5

30 25 20 15 10 5 0 高二 高三 看护孩子 商店销售 餐饮服务 其他零工

左侧Y轴名称为:打工人数百分比 下侧X轴名称为:打工方式 第三章 集中量数

1. 应用算术平均数表示集中趋势要注意什么问题?

应用算术平均数必须遵循以下几个原则:

① 同质性原则。数据是用同一个观测手段采用相同的观测标准,能反映某一问题的同

一方面特质的数据。

② 平均数与个体数据相结合的原则 ③ 平均数与标准差、方差相结合原则

2. 中数、众数、几何平均数、调和平均数个适用于心理与教育研究中的哪些资料?

中数适用于:① 当一组观测结果中出现两个极端数目时 ② 次数分布表两端数据或个别数据不清楚时 ③ 要快速估计一组数据代表值时

众数适用于:①要快速且粗略的求一组数据代表值时 ②数据不同质时,表示典型情况③次数分布中有两极端的数目时 ④粗略估计次数分布的形态时,用M-Mo作为表示次数分布是否偏态的指标(正态:M=Md=Mo; 正偏:M>Md>Mo; 负偏:M

几何平均数适用于①少数数据偏大或偏小,数据的分布成偏态 ②等距、等比量表实验③平均增长率,按一定比例变化时

调和平均数适用于①工作量固定,记录各被试完成相同工作所用时间 ②学习时间一定,记录一定时间内各被试完成的工作量

3. 对于下列数据,使用何种集中量数表示集中趋势其代表性更好?并计算它们的值。

⑴ 4 5 6 6 7 29 中数=6 ⑵ 3 4 5 5 7 5 众数=5

⑶ 2 3 5 6 7 8 9 平均数=5.71 4. 求下列次数分布的平均数、中数。

分组 65~ 60~ 55~ 50~ 45~ 40~ f 1 4 6 8 16 24 分组 35~ 30~ 25~ 20~ 15~ 10~ f 34 21 16 11 9 7

解:组中值由“精确上下限”算得;设估计平均值在35~组,即AM=37;中数所在组为35~,fMD=34,其精确下限Lb=34.5,该组以下各组次数累加为Fb=21+16+11+9+7=64

分组 65~ 60~ 55~ 50~ 45~ 40~ 35~ 30~ 25~ 20~ 15~ 10~ f 1 4 6 8 16 24 34 21 16 11 9 7 ∑N=157 组中值 67 62 57 52 47 42 37 32 27 22 17 12 d=(Xi-AM)/i 6 5 4 3 2 1 0 -1 -2 -3 -4 -5 fd 6 20 24 24 32 24 0 -21 -32 -33 -36 -35 ∑fd=-27 X?AM+?fd?i?37??27?5?36.14

N157N157?Fb?64Md=Lb+2?i=34.5+2?5?36.6

fMD34

5. 求下列四个年级的总平均成绩。

年级

x

一 90.5 236

二 91 318

三 92 215

四 94 200

n

解:XT??nX?niii?90.5?236?91?318?92?215?94?200?91.72

236?318?215?2006. 三个不同被试对某词的联想速度如下表,求平均联想速度

被试 A B C

1联想词数 13 13 13

1123(?)21313时间(分)

2 3 25 词数/分(Xi)

13/2 13/3 -

解:C被试联想时间25分钟为异常数据,删除

调和平均数MH?11?XNi??5.2

7. 下面是某校几年来毕业生的人数,问平均增加率是多少?并估计10年后的毕业人数有

多少。

年份 1978 毕业人数 542 1979 601 1980 750 1981 760 1982 810 1983 930 1984 1050 1985 1120

解:用几何平均数变式计算:

Mg=N-1XN71120??1.10925 所以平均增加率为11% X154210

10年后毕业人数为1120×1.10925=3159人

8. 计算第二章习题4中次数分布表资料的平均数、中数及原始数据的平局数。

解:组中值由“精确上下限”算得;设估计平均值在167~组,即设AM=173;中数所在组为167~,fMD=16,其精确下限Lb=166.5,该组以下各组次数累加为Fb=1+3+11+5=20

分组区间 232~ 219~ 206~ 193~ 180~ 167~ 154~ 141~ 128~ 115~ 合计 平均值X?AM+组中值(Xc)

238 225 212 199 186 173 160 147 134 121

次数(f)

2 1 6 6 14 16 5 11 3 1 ∑N=65

d=(Xi-AM)/i

5 4 3 2 1 0 -1 -2 -3 -4

fd 10 4 18 12 14 0 -5 -22 -9 -4 ∑fd=18

?fd?i=173+18?13?176.6

N65N65?Fb?20?i=166.5+2?167.3 中数Md=Lb+2fMd16原始数据的平均数=176.8

第四章 差异量数

1. 度量离中趋势的差异量数有哪些?为什么要度量离中趋势?

度量离中趋势的差异量数有全距、四分位差、百分位差、平均差、标准差与方差等等。 在心理和教育研究中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。这些特殊性常表现为数据的变异性。如两个样本的平均数相同但是整齐程度不同,如果只比较平均数并不能真实的反映样本全貌。因此只有集中量数不可能真实的反映出样本的分布情况。为了全面反映数据的总体情况,除了必须求出集中量数外,这时还需要使用差异量数。 2. 各种差异量数各有什么特点?

见课本103页“各种差异量数优缺点比较”

3. 标准差在心理与教育研究中除度量数据的离散程度外还有哪些用途?

可以计算差异系数(应用)和标准分数(应用)

4. 应用标准分数求不同质的数据总和时应注意什么问题?

要求不同质的数据的次数分布为正态 5. 计算下列数据的标准差与平均差

11.0 13.0 10.0 9.0 11.5 12.2 13.1 9.7 10.5

Xi11.0?13.0?10.0?9.0?11.5?12.2?13.1?9.7?10.5?X???11.1

N9Xi-X?A.D.=n10.7?1.19 9?6. 计算第二章习题4所列次数分布表的标准差、四分差Q

设估计平均值在167~组,即AM=173, i=13 分组区间 232~ 219~ 206~ 193~ 180~ 167~ 154~ 141~ 128~ 115~ 合计

Xc 238 225 212 199 186 173 160 147 134 121

f 2 1 6 6 14 16 5 11 3 1 65

d=(Xc-AM)/i

5 4 3 2 1 0 -1 -2 -3 -4

fd 10 4 18 12 14 0 -5 -22 -9 -4 18

fd2 50 16 54 24 14 0 5 44 27 16 250

s=2fd?Nfd??()N2?i=250182?()?13=25.2 6565N=65 65×25%=16.25 65×75%=48.75 所以Q1、Q3分别在154~组(小于其组精确下限

的各组次数和为15)和180~组(小于其组精确下限的各组次数和为36),其精确下限分别为153.5和179.5,所以有:

11?N-Fb1?65?15Q1?Lb1?4?i=153.5+4?13=156.75

f1533?N-Fb3?65?3644Q3?Lb3??i=179.5+?13=191.34

f314Q?Q3?Q1191.34-156.75==17.30 227. 今有一画线实验,标准线分别为5cm和10cm,实验结果5cm组的误差平均数为1.3cm,标准差为0.7cm,10cm组的误差平均数为4.3cm,标准差为1.2cm,请问用什么方法比较其离散程度的大小?并具体比较之。 用差异系数来比较离散程度。

CV1=(s1/X1)×100%=(0.7/1.3)×100%=53.85% CV2=(s2/X2)×100%=(1.2/4.3) ×100%=27.91%

班级 1 2 3 4 平均数 90.5 91.0 92.0 89.5 标准差 6.2 6.5 5.8 5.2 人数 40 51 48 43 di 0.3 -0.2 -1.2 1.3

?Ni?40?51?48?43?182

XT??NX?Niii?90.5?40?91.0?51?92.0?48?89.5?4316525.5??90.80

182182di?XT?Xi 其值见上表

?Nsi2ii2i?40?6.22?51?6.52?48?5.82?43?5.22?6469.79 ?40?0.32?51?(?0.2)2?48?(?1.2)2?43?1.32?147.43

2ii?NdsT??Ns?N??Nidi2i?6469.79?147.43?6.03 即各班成绩的总标准差是6.03

1829. 求下表数据分布的标准差和四分差

设估计平均数AM=52,即在50~组,d=(Xc-AM)/I计算各值如下表所示:

分组 75~80

f 1

Xc 77

累加次数 55

d 5

d 25

2

fd 25

2

fd 5

70~ 65~ 60~ 55~ 50~ 45~ 40~ 35~ 30~ 25~ 20~ 合计

2 4 5 8 10 9 7 4 2 2 1 55

272 67 62 57 52 47 42 37 32 27 22

254 52 48 43 35 25 16 9 5 3 1

4 3 2 1 0 -1 -2 -3 -4 -5 -6

16 9 4 1 0 1 4 9 16 25 36

32 36 20 8 0 9 28 36 32 50 36 312

8 12 10 8 0 -9 -14 -12 -8 -10 -6 -16

s=?fdN?(?fd)N?i=312?162?()?5?11.82 555555×25%=13.75 55×75%=41.25 所以Q1在40~组,其精确下限Lb1=39.5,小于其组的次数

为Fb1=9,其组次数f1=7;Q2在55~组,其精确下限Lb2=54.5,小于其组的次数为Fb2=35,其组次数f2=8。计算Q1、Q2如下:

11?N-Fb1?55?9Q1?Lb1?4?i=39.5+4?5=42.89

f1733?N-Fb3?55?3544Q3?Lb3??i=54.5+?5=58.41

f38Q?Q3?Q158.41-42.89==7.76 即四分位差为7.76 22第五章 相关关系

1. 解释相关系数时应注意什么?

(1) 相关系数是两列变量之间相关成都的数字表现形式,相关程度指标有统计特征数r

和总体系数ρ

(2) 它只是一个比率,不是相关的百分数,更不是等距的度量值,只能说r大比r小相关

密切,不能说r大=0.8是r小=0.4的两倍(不能用倍数关系来解释)

(3) 当存在强相关时,能用这个相关关系根据一个变量的的值预测另一变量的值 (4) -1≤r≤1,正负号表示相关方向,值大小表示相关程度;(0为无相关,1为完全正

相关,-1为完全负相关)

(5) 相关系数大的事物间不一定有因果关系

(6) 当两变量间的关系收到其他变量的影响时,两者间的高强度相关很可能是一种假象 (7) 计算相关要成对数据,即每个个体有两个观测值,不能随便2个个体计算 (8) 非线性相关的用r得可能性小,但并不能说不密切

2. 假设两变量为线性关系,计算下列各情况的相关时,应用什么方法? (1) 两列变量是等距或等比的数据且均为正态分布(积差相关) (2) 两列变量是等距或等比的数据且不为正态分布(等级相关)

(3) 一变量为正态等距变量,另一列变量也为正态变量,但人为分为两类(二列相关) (4) 一变量为正态等距变量,另一列变量也为正态变量,但人为分为多类(多列相关) (5) 一变量为正态等距变量,另一列变量为二分称名变量(点二列相关) (6) 两变量均以等级表示(等级相关、交错系数、相容系数) 3. 如何区分点二列相关与二列相关?

主要区别在于二分变量是否为正态。二列相关要求两列数据均为正态,其中一列被人为地分为两类;点二列相关一列数据为等距或等比测量数据,且其总体分布为正态,另一列变量是二分称名变量,且两列数存在一一对应关系。 4. 品质相关有哪几种?各种品质相关的应用条件是什么?

品质相关分析的总条件是两因素多项分类之间的关联程度,分为一下几类:

(1) 四分相关,应用条件是:两因素都为正态连续变量(eg.学习能力,身体状态))

人为分为两个类别;同一被试样品中,分别调查两个不同因素两项分类情况

(2) Φ系数:除四分相关外的2×2表(最常用) (3) 列联表相关C:R×C表的计数资料分析相关程度

5. 预考查甲乙丙丁四人对十件工艺美术品的等级评定是否具有一致性,用哪种相关方法?

等级相关

6. 下表是平时两次考试成绩分数,假设其分布成正态,分别用积差相关与等级相关方法计

算相关系数,并回答,就这份资料用哪种相关法更恰当?

被试 1 2 3 4 5 6 7 8 9 10 ∑

r=A 86 58 79 64 91 48 55 82 32 75 670

2B 83 52 89 78 85 68 47 76 25 56 659

2A2 B2 AB 7396 6889 7138 3364 2704 3016 6241 7921 7031 4096 6084 4992 8281 7225 7735 2304 4624 3264 3025 2209 2585 6724 5776 6232 1024 625 800 5625 3136 4200 48080 47193 46993

22RA RB 2 3 7 8 4 1 6 4 1 2 9 6 8 9 3 5 10 10 5 7 55 55

RA RB 6 56 4 24 2 54 72 15 100 35 368

D=RA-RB D2 -1 -1 3 2 -1 3 -1 -2 0 -2

1 1 9 4 1 9 1 4 0 4 34

N?XY??X?YN?X?(?X)?N?Y?(?Y)?10?46993?670?65910?48080?670?10?47193?65922?0.82

rR?1?6?D2N(N2-1)?1?6?34?0.794或 210?(10?1)34?RXRY3?4?368?rR?[?(N+1)]????11??0.794

N-1N(N+1)9?110?用积差相关的条件成立,故用积差相关更精确

7. 下列两列变量为非正态,选用恰当的方法计算相关 本题应用等级相关法计算,且含有相同等级

X有3个数据的等级相同,等级3.5的数据中有2个数据的等级相同,等级为6.5和8.5的数据中也分别有2个数据相同;Y有3个数据等级相同,等级为3的数据中有3个数据等级

相同,等级为5.5的数据中有2个数据等级相同,等级为9的数据中有3个数据等级相同。

被试 1 2 3 4 5 6 7 8 9 10 N=10 X 13 12 10 10 8 6 6 5 5 2 Y 14 11 11 11 7 7 5 4 4 4 RX 1 2 3.5 3.5 5 6.5 6.5 8.5 8.5 10 RY 1 3 3 3 5.5 5.5 7 9 9 9 D=RX-RY 0 -1 0.5 0.5 -0.5 1 -0.5 -0.5 -0.5 1 D2 0 1 0.25 0.25 0.25 1 0.25 0.25 0.25 1 4.5

n(n2-1)2(22?1)2(22?1)2(22?1)?CX??12?12?12?12?1.5 n(n2-1)3(32?1)2(22?1)3(32?1)?CY??12?12?12?12?4.5 N3?N103?10?x?12??CX?12?1.5?81

2N3?N103?10?y?12??CY?12?4.5?78

2rRC?x??y??D?2??x??y22222?81?78?4.5?0.972

281?78成绩 83 91 95 84 89 87 86 85 88 92 880

男成绩 83 84 87 86 85 425

女成绩 91 95 89 88 92 455

成绩的平方 6889 8281 9025 7056 7921 7569 7396 7225 7744 8464 77570

8. 问下表中成绩与性别是否相关?

被试 1 2 3 4 5 6 7 8 9 10 ∑ 性别 男 女 女 男 女 男 男 男 女 女

适用点二列相关计算法。p为男生成绩,q为女生成绩,Xp为男生的平均成绩,Xq为女生

的平均成绩,st为所有学生成绩的标准差

从表中可以计算得:p=0.5 q=0.5

Xp?425455?85 Xq??91 55st??XN2?(?X)N2?775708802?()?3.6 1010rpb?Xp?Xq85?91?pq??0.5?0.5??0.83 st3.6相关系数为-0.83,相关较高

9. 第8题的性别若是改为另一成绩A()正态分布的及格、不及格两类,且知1、3、5、7、

9被试的成绩A为及格,2、4、6、8、10被试的成绩A为不及格,请选用适当的方法计算相关,并解释之。

被试 1 2 3 4 5 6 7 8 9 10 ∑ 成绩A 及格 不及格 及格 不及格 及格 不及格 及格 不及格 及格 不及格 成绩B 83 91 95 84 89 87 86 85 88 92 880 及格成绩 不及格成绩 成绩的平方 83 6889 91 8281 95 9025 84 7056 89 7921 87 7569 86 7396 85 7225 88 7744 92 8464 441 439 77570

适用二列相关。st和Xt分别为成绩B的标准差和平均数,Xp和Xq分别是成绩A及格和不及格时成绩B的平均数,p为成绩A及格的比率,y为标准正态曲线中p值对应的高度

st??XN2?(?X)N2?775708802880441?()?3.6 Xt??88 Xp??88.2 1010105Xq?439查正态表得y=0.39894 ?87.8 p=0. 55Xp?Xqpq88.2?87.80.5?0.5????0.070 或者 sty3.60.39894所以rb?rb?Xp?Xtp88.2?880.5????0.070相关不大 sty3.60.3989410. 下表是某新编测验的分数与教师的评价等级,请问测验成绩与教师的评定间是否有一致性?0.871

11. 下表是9名被试评价10名著名的天文学家的等级评定结果,问这9名被试的等级评定

是否具有一致性?

被评价者 A B C D E F G H I J ∑

1 1 2 4 3 9 6 5 8 7 10 2 1 4 2 5 6 7 3 10 8 9 3 1 3 4 5 2 8 9 6 10 7 4 1 3 4 5 2 6 10 8 7 9

被试 5 1 9 2 5 6 3 4 8 10 7

6 1 4 9 2 5 6 7 3 10 8 7 1 3 5 10 2 6 9 7 8 4 8 1 3 5 7 6 4 8 10 2 9 9 1 2 8 4 9 6 3 7 5 10

∑Ri ∑Ri2 9 81 33 1089 43 1849 46 2116 47 2209 52 2704 58 3364 67 4489 67 4489 73 5329 495 27719

适用肯德尔W系数。

s=?R?2i(?Ri)2N4952?27719??3216.5

10W=s12KN(N3-N)12?3216.51?92?(103-10)12?0.481 即存在一定关系但不完全一致

12. 将11题的结果转化为对偶比较结果,并计算肯德尔一致性系数

A B C D E F G H I J A 0 0 0 0 0 0 0 0 0 B 9 2 2 4 1 2 2 1 1 C 9 7 3 4 3 2 2 2 2 D 9 7 6 4 3 4 1 2 1 E 9 5 5 5 4 4 3 3 0 F 9 8 6 6 5 3 2 2 2 G 9 7 7 5 5 6 4 3 3 H 9 7 7 8 6 7 5 5 4 I 9 8 7 7 6 7 6 4 4 J 9 8 7 8 9 7 6 5 5 已知N=10,K=9 选择对角线以下的择优分数 ?r?294

2ij?rij?94 U??rij(上)8(?rij2?K?rij)N(N-1)?K(K-1)?1?8(294?9?94)?1?0.319

10(10-1)?9(9-1)或者选择对角线上的择优分数

?r2ij(上)?2247 ?311

U?8(?rij2(上)?K?rij)(上)N(N-1)?K(K-1)?1?8(2247?9?311)?1?0.319

10(10-1)?9(9-1)13.

第六章 概率分布

1. 概率的定义及概率的性质

表明随机事件发生可能性大小的客观指标就是概率

2. 概率分布的类型有哪些?简述心理与教育统计中常用的概率分布及其特点

概率分布是指对随机变量取值的概率分布情况用数学方法(函数)进行描述。概率分布依据不同的标准可以分为不同的类型: (一) 离散分布与连续分布

连续分布指连续随机变量的概率分布,即测量数据的概率分布,如正态分布 离散分布是指离散随机变量的概率分布,即计数数据的概率分布,如二项分布 (二) 经验分布与理论分布

经验分布指根据观察或试验所获得的数据而编制的次数分布或相对频率分布

理论分布有两个含义,一是随机变量概率分布的函数-数学模型,二是指按某种数学模型计算出的总体的次数分布

(三) 基本随机变量分布与抽样分布

基本随机变量分布指理论分布中描述构成总体的基本变量的分布,常用的有二项分布与正态分布

抽样分布是样本统计量的理论分布,又称随机变量函数的分布,如平均数,方差等 3. 何谓样本平均数的分布

所谓样本平均数的分布是指从基本随机变量为正态分布的总体(又称母总体)中,采用有放回随机抽样方法,每次从这个总体中抽取大小为n的一个样本,计算出它的平均数

X1,然后将这些个体放回去,再次取n个个体,又可计算出一个X2,……再将n个个

体放回去,再抽取n个个体……,这样如此反复,可计算出无限多个X,理论及实验证明这无限多个平均数的分布为正态分布。

4. 从N=100的学生中随即抽样,已知男生人数为35,问每次抽取1人,抽的男生的概率

是多少?(35/100=0.35)

5. 两个骰子掷一次,出现相同点数的概率是多少?

11??0.028 666. 从30个白球20个黑球共50个球中随机抽取两次(放回抽样),问抽一黑球与一白球的

概率是多少?两次皆是白球与两次皆是黑球的概率各是多少?

30202030????0.48 (一黑一白) 505050502020??0.16 (皆是黑球) 50503030??0.36 (皆是白球) 50507. 自一副洗好的纸牌中每次抽取一张。抽取下列纸牌的概率是多少?

(1) 一张K 4/54 (2) 一张梅花 13/54 (3) 一张红桃 13/54 (4) 一张黑心 13/54

(5) 一张不是J、Q、K牌的黑桃 10/54 8. 掷四个硬币时,出现一下情况的概率是多少?

服从二项分布b(4, 0.5)

22(1) 两个正面两个反面 C24()()?12123 814101)()? 221611131(3) 三个反面 C1()()? 4224115(4) 四个正面或三个反面 ??

41616111(5) 连续掷两次无一正面 ??1616256(2) 四个正面 C44(9. 在特异功能试验中,五种符号不同的卡片在25张卡片中各重复5次,每次实验自25张卡片中抽取一张,记下符号,将卡片送回。共抽25次,每次正确的概率是1/5.写出实验中的二项式。问这个二项式分布的平均数和标准差各等于多少? 服从二项分布b(25, 0.2)

μ?np?25?0.2?5

σ=npq?25?0.2?0.8?2

10. 查正态表求:

(1) Z=1.5以上的概率 0.5-0.43319=0.06681 (2) Z=-1.5以下的概率 0.5-0.43319=0.06681 (3) Z=±1.5之间的概率 0.43319×2=

(4) P=0.78 Z=? Y=? Z=0.77 Y=0.29659 (5) P=0.23 Z=? Y=? Z=-0.74 Y=0.30339

(6) Z为1.85至2.10之间的概率?0.48214-0.46784=0.0143 11. 在单位正态分布中,找出有下列个案百分数的标准测量Z的分值

(1)85 (2)55 (3)35 (4)42.3 (5)9.4

12. 在单位正态分布中,找出有下列个案百分数的标准测量的Z值

(1)0.14 (2)0.62 (3)0.375 (4)0.418 (5)0.729

13. 今有1000人通过一数学能力测验,欲评为六个等级,问各个等级评定人数应是多少?

解:6σ÷6=1σ,要使各等级等距,每一等级应占1个标准差的距离,确定各等级的Z分数界限,查表计算如下:

分组 1 2 3 4 5 6 各组界限 2σ以上 1σ~2σ 0~1σ -1σ~0 -2σ~-1σ -2σ以下 比率p 0.02275 0.13591 0.34134 0.34134 0.13591 0.02275 人数分布p×N

23 136 341 341 136 23

14. 将下面的次数分布表正态化,求正态化T分数

分组 组中值 55~ 50~ 45~ 40~ 35~ 30~ 25~ 20~ 15~ 10~

52 47 42 37 32 27 22 17 12 7

f 2 2 6 8 12 14 24 12 16 4

各组中

上限以点以下下累加 累加次

100 99 98 97 96 93 90 86 82 76 70 63 56 44 32 26 20 12 4 2

累积

百分比 99% 97% 93% 86% 76% 63% 44% 26% 12% 2%

Z 2.33 1.88 1.48 1.08 0.71 0.33 -0.15 -0.64 -1.175 -2.05

正态化T分数 T=10Z+50

73.3 68.8 64.8 60.8 57.1 53.3 48.5 43.6 38.25 29.5

15. 掷骰子游戏中,一个骰子掷6次,问3次及3次以上6点向上的概率各是多少?

服从二项分布:

513次:b(3, 6, 16)=C6?(6)?(6)?0.054

3333次以上:

456?352515011141516b(4, 6, 16)?b(5, 6, 6)?b(6, 6, 6)=C6?(6)?(6)?C6?(6)?(6)?C6?(6)?(6)?8.7?105555111或者用1?C6?(16)?(6)?C6?(6)?(6)?C6?(6)?(6)?C6?(6)?(6)

00611522433316. 今有四择一选择测验100题,问答对多少题才能说是真的会答而不是猜测?

解:服从二项分布,p=1/4, q=3/4, np=100×1/4=25>5,此二项分布接近正态,故:

3μ?np?25 σ?npq?4.3根据正态分布概率,当Z=1.645时,该点以下包含了全体的95%。如果用原是分数表示,则为μ?1.645σ?25?1.645?4.33?32.12?33,即完全凭猜测,100题中猜对33题以下的可能性为95%,猜对33题及以上的概率仅为5%。所以答对33题才能说是真的会而不是猜测。

17. 一张考卷中有15道多重选择题,每题有4个可能的回答,其中至少有一个是正确答案。

一考生随机回答,(1)答对5至10题的概率,(2)答对的平均题数是多少?

18. E字形试标检查儿童的视敏度,每种视力值(1.0,1.5)有4个方向的E字各有两个(共

8个),问:说对几个才能说真看清了而不是猜测对的?

解:服从二项分布,n=8,p=1/4,np=2<5,所以不能用正态分布概率算,而直接用二项分布算:

87303118117b(8, 8, 14)=C8?(4)?(4)?0.000015 b(7, 8, 4)=C8?(4)?(4)?0.000366 65323316115b(6, 8, 14)=C8?(4)?(4)?0.003845 b(5, 8, 4)=C8?(4)?(4)?0.023071 43414b(4, 8, 14)=C8?(4)?(4)?0.0865

由以上计算可知说对5个及5个以上的概率总和为

0.000015+0.000366+0003845+0.023071=0.027297=2.73%<5%

而说对4个及以上概率总和为0.027297+0.0865=0.1138=11.38% 大大超过5%的误差范围,不可取。所以至少说对5个才能才能认为是看清了而不是猜测对的,作此结论犯错误的概率为2.73%。

19. 一学生毫无准备参加一项测验,其中有20道是非题,他纯粹是随机地选择“是”和“非”,

试计算:(1)该学生答对5题的概率;(2)该学生至少答对8题的概率 解:服从二项分布 n=20, p=0.5 np=10>5,可用正态分布概率作近似值。

11?0.0148 答对5题的概率是b(5, 20, 12)=C20?(2)?(2)5515至少答对8题的概率用正态分布概率近似计算如下:

μ?np?20?0.5?10 σ?npq?数为Z?20?0.?50.?52.236 所以答对8题的Z分

X?μ8?10???0.894 所以答对至少8题的概率即为Z=-0.894以上的概σ2.236率。当Z=0.894时查正态表的概率为0.31327,所以Z=-0.894以上的概率为

0.5+0.31327=0.81327,即至少答对8题的概率为0.81327

20. 设某城市大学录取率是40%,求20个参加高考的中学生中至少有10人被录取的概率。

解:服从二项分布 n=20,p=0.4,q=0.6。因为np=5,可以用正态分布概率作近似计算。

μ=np=5,σ2=npq?20?0.4?0.6?2.19 10人被录取时的Z分数为

Z?X?μ10?5??2.2,至少8310人被录取的概率即为Z=2.283以上的概率,查表σ2.19得Z=2.283时p=0.48870,所以Z=2.283以上的概率为0.5-0.48870=0.0113,即至少10人被录取的概率为1.13% 解2:设X为录取人数,则

P{X?10}?P{X?510?510?5?}?1??()?1??(2.28)?0.0113 2.192.192.1921. 已知一正态总体μ=10,σ=2。今随机取n=9的样本,X?12,求Z值,及大于该Z以

上的概率是多少?

解:属于样本分布中总体正态,方差已知的情况:

X?μX12?10σ??3,查表得Z=3时p=0.49865,所以大μX=μ,σX=,所以Z?σ2/9nX于Z=3的概率是0.5-0.49865=0.00135

22. 从方差未知的正态总体(μ=50)中抽取n=10的样本,算得平均数X?53,Sn?1?6,

问大于该平均数以上的概率?

解:总体正态方差未知,服从t分布

t=X-μX-μ53?50=??1.581 df=9

sn/n-1sn-1/n6/10查表当df=9时没有准确的p对应,采用内插法单侧界限概率:

t=1.383以上概率为p=0.1,t=1.833以上概率为p=0.05,令t=1.581以上概率为p,则:

1.83?1.5810.05?p 解得p=0.078 ?1.581?1.383p?0.1所以大于该平均数以上的概率是0.078

23. 已知χ2?12,df?7,问该χ2以上及以下的概率是多少?

解,查表得df=7时,χ2?12以上的概率是0.100,以下概率为1-0.100=0.900

224. 已知从正态总体??10,抽取样本n=15计算的样本方差Sn?1?12,问其χ2是多少?

2并求小于该χ2值以下的概率是多少? 解:不知总体平均数时,df=n-1=14

χ2?(X-X)=σi22ns2(n-1)s214?12n-1=2=??16.8 2σσ1022查表得df=14时,χ?13.3以上概率为0.5,χ?17.1以上概率为0.25,采用内插法,令χ?16.8以上概率为p,则

217.1?16.80.25?p 解得p=0.27,所以小于该χ2值以下的概率是1-p=0.73 ?16.8?13.3p?0.525. 从??25的正态总体中,随机抽取n=10的样本为:10、20、17、19、25、24、22、

31、26、26,求其χ值,并求大于该值的概率?

22ns2解:正态总体平均数未知,df=n-1=9,χ=2

σ2计算s?2N?X2-(?X)2N22ns210?30.8?30.8,代入χ=2??12.32

σ252查df=9时,χ=12.32以上概率用内插法得该值的概率为0.208

14.7?12.320.1?p? p=0.208,即大于

12.32?11.4p?0.2526. 若上题μ?23已知,其χ又是多,大于该值以上的概率又是多少?

22解,正态总体平均数已知,χ?(X-μ)=σ22,df=n=10

代入数据得χ2?(X-μ)=σ22?318?12.72 25?df?10?查表计算?16.0?12.720.1?p得出p=0.241,即大于该值以上的概率为0.241

??12.72?12.5p?0.25?27. 已知从一正态总体中抽取两样本n1?15,Sn1?1?20;n2?16,Sn2?1?17,问两样本

方差之比是否小于F0.05? 解:同一总体方差相等 样本方差比为

第七章 参数估计 第八章 假设检验 第九章 方差分析 第十章 X2检验

第十一章 非参数检验 第十二章 线性回归

第十三章 多变量统计分析简介 第十四章 抽样原理及方法

22