7、 简述中心极限定理 设从均值为?,方差为
??的任意一个总体中抽取样本容量为n的随机样本,则当n充分大时,样本
?/n的正态分布
H:?≥?0,Ho:?<?0;
o均值x的抽样分布近似服从均值为?,方差为
8、 写出大样本条件下总体比率左侧检验的基本步骤。
(1) 根据问题要求提出原假设和备择假设,
(2)确定适当的检验统计量及相应的抽样分布——(正态分布)N(0,1); (3)选取显著水平?,确定原假设(4)计算统计量的值;
(5)作出决策,若P≤?,则拒绝
HHo的接受域为
z?值得右侧,拒绝域为z?的左侧;
Hoo,若P≥?,则接受
9、 简述样本容量与置信水平、总体方差、允许误差间的关系?
(1)样本容量与置信水平成正比,即当样本容量越大时,置信水平越高; (2)样本容量与总体方差成反比,即当样本容量越大时,总体方差越小; (3)样本容量与允许误差成反比,即当样本容量越大时,允许误差越小。 10、 评价优良估计量的主要标准有哪些?并对每一标准作出说明。
无偏性:不是要求估计量与总体参数不得有偏差,而是指如果对同一个总体反复抽样,则要求各个样本所得出所谓的估计量(统计量)的平均值等于总体参数;
有效性:估计量与总体之间存在的方差越小,估计量对总体的估计也就越准确,估计量越有效; 一致性:当样本量逐渐增加时,样本的估计量能够逐渐逼近总体参数。 11、 在研究方法上,参数估计与假设检验有什么相同点和不同点? 相同点:在研究方法上,它们都利用样本对总体进行某种推断;
不同点:推断角度不同,参数估计讨论的是用样本统计量估计总体参数的方法,总体参数?在估计前是未知的,而在假设检验中,则是先对?的值提出一个假设,然后利用样本信息去检验这个假设是否成立。
12、 什么是方差分析?它的基本思想和原理是什么?简述方差分析的基本步骤?
方差分析就是针对一定因素分析各总体的各个因素水平是否有差异,分为单因素方差分析和双因素方差分析,单因素方差分析是针对一个因素进行的,而双因素方差分析则是针对两个因素进行的。 基本思想:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
基本原理是认为不同处理组的均数间的差别基本来源有两个:
(1) 随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示, 记作SSw,组内自由度dfw。
(2) 实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差平方和表示,记作SSb,组间自由度dfb。
步骤:
(1)建立原假设和备择假设; (2)选择显著性水平; (3)确定决策点; (4)计算并决策。
13、 写出一元线性回归分析中回归方程线性关系显著性检验的基本步骤。 (1)提出假设:H0:?i?0 H1:?i?0
(Ho即自变量与因变量的线性关系不显著,
Ho即两者关系显著);
(2)计算检验统计量F F=SSR/1 SSE/(n-2) F(1,n-2);
(3)确定显著性水平α,并根据分子自由度1和分母自由度(n-2)找出临界值F; (4)作出决策:若F>F ,则拒绝
Ho;若F≤F ,则接受
Ho
14、 解释总误差平方和SST、水平项平方和SSA、误差项平方和SSE的含义及三者的关系。
SST是每个观察值的整体均值之间的平方差之和;
SSA每个水平的平均观察值与总体均值之间平方差之和,反映各总体的样本均值之间的差异程度; SSE是组内平方和,是反映每个样本各观察值的离散程度; SST=SSA+SSE
15、 解释总平方和SST、回归平方和SSR、残差平方和SSE的含义及三者间的关系?
总平方和SST是观测值与其平均值的偏差之和,反映因变量的n个观察值与其均值的总离差; 回归平方和SSR反映自变量x的变化对因变量与取值变化的影响,值越大,占得比重就越大; 残差平方和SSE反映除x以外的其他因素,对y取值的影响,也称为不可解释的平方和; SST=SSR+SSE
16、 简述一元线性回归模型
Yi????Xi?? 的基本假定?
模型中,y是Xi的线性部分加上误差项而得到的,线性部分a+BXi反映了由于Xi的变化而引起的y的变化,误差项
是随机变量是不能有Xi和y之间的线性关系所解释的变异性,它反映了除Xi和y之间
的线性关系之外的随机因素对y的影响,误差项假设是一个服从正态分布的随机变量,且相互独立。
三、计算题
1、甲、乙两个班参加同一学科考试,甲班的平均考试成绩为86分,标准差为12分。乙班考试成绩的分布如下: 考试成绩(分) 60以下 60—70 70—80 80—90 90—100 合计 要求:(1)计算乙班考试成绩的均值及标准差; (2)比较甲乙两个班考试成绩的离散程度大?
2、某地区家庭按人均收入水平分组资料如下表所示: 按月收入水平分组(元) 400~600 600~800 800~1000 1000以上 合计 计算:(1)众数、中位数与平均数
(2)标准差系数 (3)分析数据的偏斜方向?
家庭数(户) 20 45 25 10 100 学生人数(人) 2 7 9 7 5 30 3、一家网吧想了解上网人员的年龄分布状况,随机抽取25人,得到他们的年龄数据如下表所示: 15 19 22 24 30 16 19 22 24 31 17 20 23 25 34 18 20 23 27 38 19 21 23 29 41 (1)画出该组数据的茎叶图 (2)画出该组数据的箱线图
(3)根据茎叶图和箱线图说明上网者年龄的分布特征。
4、某种生产线的感冒冲剂规定每包重量为12克,超重或过轻都是严重问题,从过去的资料可知?是0.6,质检员每小时抽取25包冲剂称重检验,并做出是否停工的决策。假定产品重量服从正态分布。(
z0.05?1.65,z0.025?1.96)
(1)建立适当的原假设与备择假设。
(2)当?=0.05时,该检验的决策准则是什么? (3)如果x=12.25克,你将做出什么决策? (4)如果x=11.95克,你将做出什么决策?
??