数理统计课件 下载本文

课程介绍

学习对象:数学应用数学专业专科升本科第二年级的学生。 内容简介:

数理统计学是一门应用性很强的学科,它是研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测. 数理统计是运用概率论的基本知识,对要研究的随机现象进行多次观察或试验,研究如何合理地获得数据资料,建立有效的数学方法,根据所获得的数据资料,对所关心的问题作出估计与检验。数理统计的重要分支有统计推断、多元统计分析、试验设计等,它已成为各学科从事科学研究及生产经济等部门进行有效工作的必不可少的数学工具。

本课程的主要内容为数理统计学中最基本的概念、思想和方法。介绍数理统计的基本概念及抽样分布、参数估计、假设检验、回归分析与方差分析。

建议学时:本课程属于专业选修课,建议学习54课时。

先修课程:数学分析(或高等数学)、高等代数(或线性代数)、概率论。 参考教材

1 《概率论与数理统计教程》,高等教育出版社,2004,茆诗松 程依明 濮晓龙 编著。 2《概率论及数理统计》,高等教育出版社,2002,中山大学数学系梁之舜等编著。

第一章 数理统计的基本概念与抽样分布

一.教学目的

1 正确理解总体、个体、简单随机样本、统计量等概念;了解直方图的画法。

2 熟悉样本均值、样本方差和样本的高阶矩。 3 熟悉并理解样本数字特征的分布;

4 掌握三类重要分布的定义及性质,熟练运用抽样分布定理及其推论。 二.内容提要

本章主要介绍数理统计的一些基本概念:总体、样本、统计量和样本的数字特征。以及样本的数字特征的分布、三类重要分布和抽样分布定理。

数理统计作为一门学科诞生于19世纪末20世纪初, 是具有广泛应用的一个数学分支, 它以概率论为基础, 根据试验或观察得到的数据, 来研究随机现象, 以便对研究对象的客观规律性作出合理的估计和判断。

由于大量随机现象必然呈现出它的规律性, 故理论上只要对随机现象进行足够多次观察, 则研究对象的规律性就一定能清楚地呈现出来, 但实际上人们常常无法对所研究的对象的全体(或总体) 进行观察, 而只能抽取其中的部分(或样本) 进行观察或试验以获得有限的数据。

数理统计的任务包括: 怎样有效地收集、整理有限的数据资料; 怎样对所得的数据资料进行分析、研究, 从而对研究对象的性质、特点, 作出合理的推断, 此即所谓的统计推断问题。 本课程主要讲述统计推断的基本内容。

数理统计同概率论一样,其研究对象也是随机现象,但研究方法不同,数理统计是通过对随机现象的观测或试验来获取数据,通过对数据的分析与推断去寻找隐藏在数据中的统计规律性。它是研究怎样以有效的方式收集、整理、分析带随机性的数据,并在此基础上,对所研究的问题做出统计推断,直至对可能作出的决策提供依据或建议。概率论为数理统计提供理论基础。

数理统计的特点是应用面广,分支较多。社会的发展不断向统计提出新的问题。本课程内容重点在于介绍应用数理统计的一些重要概念和典型方法,它们是实际中最常用的知识。

第一节 总体与样本

第一教学单元

导言:主要介绍总体及其分类,样本,简单随机样本及其概率分布。理解总体、个体、样本和简单随机样本的概念。会求简单随机样本的联合分布函数、联合概率分布律或联合概率密度。

一、总体与个体

统计中常把所研究对象的全体称为总体或母体,构成总体的每个成员称为个体。总体中所包含的个体的个数称为总体的容量。例如:某工厂生产的灯泡的寿命是一个总体,每一个灯泡的寿命是一个个体;某学校男生的身高的全体一个总体,每个男生的身高是一个个体。然而在数理统计研究中,人们往往研究有关对象的某一项(或几项)数量指标。为此对这一指标进行随机试验,观察试验结果全部观察值,从而考察该数量指标的分布情况,这时,每个具有的数量指标的全体就是总体,每个数量指标就是个体。例如,把某月的整批产品视为一总体,则每个产品为个体;若只要检查产品的质量,可用数量表征X来反映。产品分别为一、二、三等品,令X取值分别为1、2、3。因此为了更清楚的表示总体,可以用随机变量X或其概率分布来表示总体。当用随机变量X表示总体时,可以简称总体X,如果X的分布函数为F(x),那么F(x)也是总体的分布函数,所以也可以用F(x)表示一个总体。譬如当描述总体的随机变量X服从正态分布时,也称该总体为正态总体;今后称“从某总体中抽样”也可称“从某分布中抽样”。

在统计中,用来描述总体的分布通常是未知的,因此确定总体的概率分布就是统计所要研究的一个问题。有的总体的分布类型是已知的,但是其中的参数未知,那时就要研究如何确定总体的参数。在有些问题中,我们对每一研究对象可能要观测两个或多个指标,则可用多维随机向量(X1,X2,L,Xp)去描述总体,也可用其联合分布函数F(x1,x2,L,xp)去描述总体,这种总体称为p维总体。这是“多元分析”中研究的对象。我们主要研究一维总体,有时会涉及二维总体。在研究某地区中学生的营养状况时 ,若关心的数量指标是身高和体重,我们用X 和Y 分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数 F(x,y)来表示.

总体还有有限总体与无限总体,总体容量有限的总体称为有限总体,总体容量无限的总体称为无限总体。本课件将以为无限总体主要研究对象。

二.样本

由于总体可以用随机变量X来描述,因此研究总体就要研究X的分布或分布的某些特征量。这就需要对总体进行观察。为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为 “抽样”,从总体中抽出的部分个体组成的集合称为样本(也称为子样),样本中所含个体称为样品,样本中样品的个数称为样本容量(也称样本量)。

例1 对某型号的20辆汽车记录每加仑汽油各自行驶的里程数(单位:公里)如下: 29.8 27.6 28.3 28.7 27.9 30.1 2 9.9 28.0 28.7 27.9

28.5 29.5 27.2 26.9 28.4 27.8 28.0 30.0 29.6 29.1

这是一个容量为20的样本的观察值,对应的总体是该型号汽车每加仑汽油行驶的里程。 在样本中常用n表示样本容量,从总体中抽出的容量为n的样本记为(X1,X2,L,Xn),这里每个Xi都看成是随机变量,因为第i个被抽到个体具有随机性,在观察前是不知其值的。样本的观察值记为(x1,x2,L,xn)。样本(X1,X2,L,Xn)所可能取值的全体称为样本空间。一个样本观察值(x1,x2,L,xn),就是样本空间的一个点。

我们抽取样本的目的是为了对总体进行各种分析推断。为了能从样本正确推断总体就要求所抽取的样本能很好地反映总体的信息,所以要有一个正确的抽取样本的方法。最常用的抽取样本的方法是“简单随机抽样”,它要求抽取的样本满足如下要求: (1)代表性,即要求每一个体都有同等机会被选入样本,这意味着每个分量Xi与总体X有相同的分布F(x)。

(2)独立性,即要求样本中每一样品取什么值不受其它样品的影响,这意味X1,X2,L,Xn 为相互独立的随机变量。

满足上述两点性质的样本称为简单随机样本,获得简单随机样本的抽样方法称为简单随机抽样。今后若不作特别说明均指简单随机样本,对于简单随机样本(X1,X2,L,Xn),其分布可由总体的分布函数F(x)完全决定,(X1,X2,L,Xn)的分布函数是

F(x1,x2,L,xn)??F?xi?。若设X的概率分布律为P?X?x?,则(X1,X2,L,Xn)的

i?1n联合概率分布律为:P(X1?x1,X2?x2,L,Xn?xn)??P?Xi?1ni?xi?;若设X的概率密

度为f,则(X1,X2,L,Xn)的联合概率密度为:f(x1,x2,L,xn)???f?x?。

ii?1n统计是从手中已有的资料——样本观察值,去推断总体的情况——总体分布。样本是联系两者的桥梁。总体分布决定了样本取值的概率规律,也就是样本取到样本观察值的规律,因而可以用样本观察值去推断总体。

总体、样本、样本值的关系:

总体

↙ ↖推断

(个体)样本 → 样本值

抽样

练习

1、设一组抽奖券共10000张,其中有5张有奖。问连续抽取3张均有奖的概率为多少? 解: 不妨设

?1,第i次抽到奖 Xi???0,第i次未抽到奖要求该事件的概率,实际上即是求联合概率分布

P{X1?x1,X2?x2,X3?x3}(xi?0或1)

在x1?x2?x3?1处的值。但题中没有说明“连续抽取”是“有放回的”还是“无放回的”,我们不妨都计算一下: (ⅰ)无放回时:

P{X1?1,X2?1,X3?1}?(ⅱ)有放回时:

543

10000999999983555?5?P{X1?1,X2?1,X3?1}????.

100001000010000?10000?2、考虑如何由样本X1,X2,?,Xn的实际背景确定统计模型,即总体X的分布: (ⅰ) 样本记录随机抽取的n件产品的正品、废品情况。 (ⅱ) 样本表示同一批n个电子元件的寿命(小时)。 (ⅲ) 样本表示同一批n件产品某一尺寸(mm)。

解:(ⅰ) X服从两点分布,其概率分布为px(1?p)1?x,x=0,1,所需确定的是参数p?[0,1]. (ⅱ) X通常服从指数分布,其密度函数

??e??x,x?0f(x;?)??x?0 ?0,所需确定的是参数?>0.

2(ⅲ) X通常服从正态分布N(?,?),其密度函数

f(x;?,?2)?1e2???(x??)22?2,x?R

22所需确定的是参数(?,?),其中??R,??0。

相关资源:

《概率论与数理统计教程》,高等教育出版社,2004,茆诗松 程依明 濮晓龙 编著。

讨论交流:

1、 什么是总体?总体分为哪两类?

2、 简单随机样本的概念,如何求简单随机样本的概率分布律或概率密度函数? (可从课件中直接找到)