统计学简答题及参考答案
1.简述描述统计学的概念、研究内容与目的。
概念:它是研究数据收集、整理和描述的统计学分支。
研究内容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。 研究目的:描述数据的特征;找出数据的基本数量规律。 2.简述推断统计学的概念、研究内容与目的。
概念:它是研究如何利用样本数据来推断总体特征的统计学分支。 研究内容:参数估计和假设检验的理论与方法。 研究目的:对总体特征作出统计推断。 3.什么是总体和样本?
总体是指所研究的全部个体(数据)的集合,其中的每一个元素称为个体(也称为总体单位)。
可分为有限总体和无限总体:
?有限总体的范围能够明确确定,且元素的数目是有限的,可数的。 ?无限总体所包括的元素数目是无限的,不可数的。 总体单位数可用N表示。
样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量,记为n 。
4.什么是普查?它有哪些特点?
普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。它有以下的特点:
1) 通常是一次性或周期性的
2) 一般需要规定统一的标准调查时间 3) 数据的规范化程度较高 4) 应用范围比较狭窄。
5.什么是抽样调查?它有哪些特点?
抽样调查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据搜集方法和统计推断方法。
它具有经济性好、时效性强、适应面广、准确性高等特点。 6.简述统计调查方案的概念及应包括的基本内容。
答:统计调查方案就是统计调查前所制订的实施计划,它是指导整个调查过程的纲领性文件,是保证调查工作有计划、有组织、有系统地进行的计划书。
它应包括的基本内容有: 〈1〉明确调查目的;
〈2〉确定调查对象和调查单位; 〈3〉设计调查项目;
〈4〉设计调查表格和问卷; 〈5〉确定调查时间;
〈6〉组织实施调查计划;
〈7〉调查报告的撰写,等等。
7.简述统计分组的概念、原则和具体方法。
答:(1)概念
根据统计研究的目的和客观现象的内在特点,按照某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。
统计分组标志有两种:品质标志或数量标志。 (2)原则
①穷尽原则;②互斥原则。
即“不重复、不遗漏”的原则。 (3)具体分组方法 ①按品质标志分组 ②按数量标志分组
(A)单项式分组与组距式分组;
(B)间断组距式分组和连续组距式分组;
应遵循“上限不在组内”原则:凡是总体中某一个单位的变量值为相邻两组的界限值,则这一个单位就归入作为下限值的那一组内。
(C)等距分组与异距分组。
8.简述组距分组的基本步骤。
(1)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的 (2)确定组距:组距是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即:
组距=(最大值 - 最小值)÷ 组数
(3)统计出各组的频数,并整理成频数分布表。 9.简述算术平均数的概念及其数学性质。
答:算术平均数是指一组数据的总和,除以这组数据的项数所得的结果。它是最常用的数值平均数,分为简单算术平均数和加权算术平均数两种。 其数学性质是:
(1)算术平均数与变量值个数的乘积,等于各个变量值的总和。 (2)各变量值与其算术平均数的离差之总和,等于零。
(3)各变量值与其算术平均数的离差平方之总和,为最小值。 10.简述均值的概念和特征。
均值就是算术平均数,它的基本公式为:
算术平均数=总体标志总量/总体单位数=∑Xi/n 其特征如下:
1) 集中趋势的最常用测度值 2) 一组数据的均衡点所在 3) 体现了数据的必然性特征 4) 易受极端值的影响
5) 用于数值型数据,不能用于分类数据和顺序数据
6) 可根据原始数据或者分组数据来计算,计算公式略有差异。 11.简述众数、中位数、均值的特点与应用场合。 1) 众数
? 不受极端值影响 ? 具有不唯一性
? 数据分布偏斜程度较大时应用 2) 中位数
? 不受极端值影响
? 数据分布偏斜程度较大时应用 3) 均值
? 易受极端值影响 ? 数学性质优良
? 数据对称分布或接近对称分布时应用。
12.简述算术平均数、众数、中位数的概念及数量关系。
答:(1)概念
算术平均数是指一组数据的总和除以这组数据的项数所得的结果,也称为均值, 可用X表示。它是最常用的数值平均数,分为简单的和加权的算术平均数两种。
众数是指一组数据中出现频数最多、频率最高的变量值,可用 MO 表示。它是最常见、最普遍的状况,是对现象集中趋势的度量。
中位数是指将数据由小到大排列后,位置居中的数值,可用 Me 表示。 (2)三者的数量关系是: 在对称分布中,三者相等。即:X=Me=Mo;
在左偏分布中,一般有X 在轻微偏态时,三者的近似数量关系为:(X?Mo)?3?(X?Me)。 13.测定离散程度的变异指标有哪些?简述其主要作用。 答:常用的变异指标有:异众比率、极差、四分位差、平均差、方差和标准差、离散系数等。 它们的主要作用为: 1.说明数据的分散程度,反映变量的稳定性、均衡性; 数据之间差异越大,表明变量的稳定性或均衡性越差。 2.衡量平均数的代表性高低; 离散程度越大,表明平均数的代表性就越低。 3.作为统计推断的重要依据。 ①判别统计推断的前提条件是否成立; ②衡量推断效果好坏的重要尺度。 14.简述方差和标准差的概念及其特征。 方差是指各变量值与均值的离差平方的算术平均数,标准差则是方差的正平方根。 两者都是标志变异指标,具有以下的特征: ? 离散(变异)程度的测度值之一 ? 最常用的测度值 ? 反映了数据的分布特征 ? 反映了各变量值与均值的平均差异 ? 用于数值型数据,不能用于分类数据和顺序数据 ? 可根据总体数据或者样本数据来计算,计算公式略有差异。 15.什么是离散系数? 是变异指标与其相应的均值之比 通常是用标准差与均值来对比 是对数据相对离散程度的测度 消除了数据水平高低和计量单位不同的影响 用于对不同组别数据离散程度的比较 计算公式为: s?v?v??s?sx?x16.简述概率抽样方式的概念和特点。 是指根据一个已知的概率来抽取样本单位,也称为随机抽样。 它包括四种基本抽样方式:简单随机抽样、分层抽样、系统抽样和整群抽样等。 其特点是: ? 按一定的概率以随机原则抽取样本; 抽取样本时,使每个单位都有一定的机会被抽中。 ? 每个单位被抽中的概率是已知的,或是可以计算出来的; ? 当用样本对总体参数进行估计时,要考虑到每个样本单位被抽中的概率。 17.什么是抽样分布? (1)是指样本统计量的概率分布,是一种理论分布 ? 在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相 对频数分布 (2)随机变量是样本统计量 ? 例如样本均值,样本比例,样本方差等 (3)结果来自容量相同的所有可能样本 (4)提供了样本统计量长远而稳定的信息,是进行抽样推断的理论基础,也是抽样推断科学性的重要依据。 18.什么是中心极限定理? 设从均值为μ,方差为σ的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ/n的正态分布,即 x~N(μ,σ/n) 。 2 2 2 19.什么是总体参数? 1) 它是描述总体数量特征的概括性数字度量 2) 是研究者想要了解的总体的某种数字特征值 3) 人们所关心的参数主要有总体均值(?)、总体标准差(?)、总体比率(ρ)等 4) 它是抽样统计推断的对象 5) 总体参数通常用希腊字母表示。 20.什么是样本统计量? 1) 它是用来描述样本数量特征的概括性数字度量,它是根据样本数据计算出 来的一些量,是样本的函数。 2) 人们所关心的样本统计量有样本均值(?x)、样本标准差(s)、样本比例(p)