学生成绩评价及预测模型
摘要
学生学业成绩的分析和评价, 是教学工作的重要环节, 也是学校常规管理的重要内容。科学地分析评价学生的学业成绩, 不仅可以使教师准确掌握学生的学习状况, 还可以使学生了解到自己的学习情况, 也能为教学管理、改进教学提供必要的依据分析。为了全面、客观、合理地评价学生的学习状况,本文通过在对基础数据进行统计分析的基础上,采用聚类分析中的k-均值聚类分析法对612名学生的成绩进行分类评价,建立了成绩评价模型。
首先,根据统计学知识,通过对附表所给的数据进行统计和整理,对612名学生的整体成绩情况进行了详细分析说明。同时运用Excel软件画出学生成绩波动图、成绩等级饼状分布图等,并对各图进行了相关分析和说明,最终得出学生总体成绩分布属于负偏态分布,绝大多数学生成绩分布在60-90分之间的结论。最后还运用非参数检验方法Kolmogorov-Smirnov检验、Shapiro- Wilk检验以及图示检验法(直方图、标准Q-Q图以及箱式检验图)对结论进行检验,使用SPSS软件进行绘图与计算,最终验证了学生成绩分布为非正态分布,且为负偏态分布的结论是正确的。
然后在数据分析的基础上上建立了基于快速聚类(k-均值聚类)分析的成绩评价模型。在确定分类数为5类后,利用SPSS进行快速聚类分析计算,结果显示其聚类中心均值依次为:62.223755、89.029319、54.237350、34.400759、14.932222,各类人数分别为231、286、84、8、3,分类结果科学合理。
为了对612名学生后两个学期的学习情况进行预测,本文采用灰色预测理论中基于时间序列的GM(1,1)一阶一元微分方程模型建立了成绩预测模型,为了保证建模方法的可行性,先对数据列进行了必要的检验处理,并且通过残差检验和级比偏差值检验两种方法对灰色预测GM(1,1)模型进行检验,结果显示模型的预测结果能达到较高的要求。最后利用Matlab编程得出预测函数,计算每个学生第5、6学期的成绩预测值以及前四个学期的拟合成绩,并且运用Kolmogorov-Smirnov检验、Shapiro- Wilk检验以及图示检验法对对第5、6学期成绩预测值的正态性分布进行检验,得出学生成绩的总体分布不服从正态分布,而是负偏态分布,与前四个学期的分析结果相吻合,因此可以判定预测结果是合理可靠的,具有较高的可信度。
本文还就学生的学习状况,对学校管理部门提出相关的建议。
最后讨论了GM(1,1)模型的推广问题,通过添加平衡因子改进模型级比数列的计算方法,以及添加上限条件修改输出函数的方法改进了模型,使得模型具有更强的适应性和更广的适用范围。
关键字:成绩预测 描述统计 k-均值聚类分析 灰色预测 GM(1,1) 负偏态分布
1
1. 问题重述
评价学生学习状况的目的是激励优秀学生努力学习取得更好的成绩,同时鼓励基础相对薄弱的学生树立信心,不断进步。
然而,现行的评价方式单纯的根据“绝对分数”评价学生的学习状况,忽略了基础条件的差异;只对基础条件较好的学生起到促进作用,对基础条件相对薄弱的学生很难起到鼓励作用。
附件给出了612名学生连续四个学期的综合成绩。
1.请根据附件数据,对这些学生的整体情况进行分析说明;
2.请根据附件数据,建立数学模型,全面、客观、合理的评价这些学生的学习状况; 3.试根据你的模型,预测这些学生后两个学期的学习情况。
4.根据你的模型分析,试给学校的管理部门写一篇短文,提出对学生学习状况评价的建议和改进方案。
2. 模型的假设与符号说明
2.1 模型的假设
1.假设每个学期的成绩满分为100分; 2.假设每位学生所处的学习考试环境相同; 3.假设每位学生的学习能力基本保持不变; 4.假设每次考试试卷的难度都是相同的。 2.2 符号说明
表示第i个学生的初始成绩数列 表示第i个学生一次累加成绩数列 表示第i个学生第k个学期数列级比 表示第i个学生第k个学期数列均值 表示第i个学生的预测成绩数列 表示第i个学生的预测的一次累加成绩数列 表示第i个学生第k个学期的残差 表示第i个学生第k个学期的级比偏差 (注:其他符号在相关位置再作假设。) 3. 问题分析
3.1 背景分析
学生成绩评价原则是指对学生成绩评价活动的共同的、理性的认识。它是学生成绩理论与学生成绩评价实践活动的纽带。学生成绩评价理论从科学角度对学生成绩的评价
2
进行研究,通常包括假设、概念、原理和原则等。学生成绩评价实践是评价学生成绩实践中所使用的原则、程序和方法。
随着社会的发展,办学规模的不断扩大,教学质量的保证和提高的问题日益凸显,各种教学研究和教学实践层出不穷,但是学生学习状况的评价作为提高教学质量和激励学生努力学习的重要手段,却没有得到应有的重视,显然传统的评价方法忽略了学生基础条件的差异,并不能对学生的学习状况进行全面、客观、合理的评价,建立一种科学的评价方法势在必行。
3.2 问题一的分析:基本数据分析
根据统计学中描述统计方法,对这612名学生的整体成绩情况进行详细分析。其中包括每个学期整体成绩的平均值、最大值、最小值、方差、标准差、差评率、优秀率等多项指标。通过对附表所给的数据进行统计整理并作出相应的波动图、直方图、饼状图等,可以更为直观地了解四个学期成绩的分布情况。最终对学生的整体情况进行全面、客观、科学的分析说明。
3.3 问题二的分析:成绩评价模型的分析
传统方法中,对个体学生的成绩进行评价的方法主要是基于基本的统计计算,比如均值、排序等。事实上,这些方法单从成绩本上来讲基本能够反映学生的学习状况,但是其中也有很多局限性,比如排序评价,A学生与B学生的成绩可能相差0.5分,但是经过排序后,就认为A学生比B学生优秀,这显然不是很合理。本文主要从实际出发,以学生心理接受程度为依据,提出依据学习成绩的实际分布情况进行分类的方法对学生学习状况进行评价。然而究竟以什么标准进行分类呢?分成多少级好呢?分好的级别能够反映怎样的学习状况呢?
目前对于已知数据进行已知分类数或者未知分类数的方法有很多,常用的有聚类分析法。聚类分析是一种探索性的分析方法,在分类的过程中,不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。聚类分析中的k-均值聚类法,又叫迭代聚类法或者快速聚类法,可以事先给出分类数,聚类的结果也比较科学和合理,本文采用该方法作为成绩评价模型的主要方法。采用该方法进行聚类时,先给对象集一个粗糙的初始分类,然后用某种原则进行修改,直到分类比较合理为止。其具体步骤如下:
1.原始数据的预处理:通过损失函数计算合理的分类数K 2.将数据分成K个初始类,并计算各初始类的中心坐标
3.通过合适的距离计算将数据重新分类,分类的原则是将样品划入离中心最近的类中,然后重新计算中心坐标
4.重复步骤3,当聚类满足算法终止条件时停止计算 3.4 问题三的分析:成绩预测模型的分析
现实中,预测问题有很多种求解模型,比如BP神经网络模型、一元线性回归模型、灰色预测模型等。对于问题三,已知一批学生的前四个学期的成绩,预测其第五六学期的成绩,非常类似于灰箱过程。在灰色系统中,灰箱是已知部分数据,进而推测其他数据的一种模型。
3
灰色预测是灰色系统的一个重要方面,它通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。灰色预测是指利用GM模型对系统行为特征的发展变化规律进行估计预测,同时也可以对行为特征的异常情况发生的时刻进行估计计算,以及对在特定时区内发生事件的未来时间分布情况做出研究等等。这些工作实质上是将“随机过程”当作“灰色过程”,“随机变量”当作“灰变量”。本文采用的是灰色系统理论中的GM(1,1)模型。 3.4.1 灰色建模可行性检验:对原始数据进行预检验与预处理
为了保证建模方法的可行性,需要对已知数据列做必要的检验处理。
设第i个学生第j个学期的成绩为
计算数列的级比
如果所有的级比
都落在可容覆盖
,即(0.67032,1.39561)(在本文
中,)范围内,则数列可以作为灰色模型GM(1,1)的数据进行灰色预测。否则,需要对数列做必要的变换处理,使其落入可容覆盖内。 3.4.2 建立GM(1,1)灰色模型
对数列
做一次累加生成1-AGO数列:
其中,
均值数列 则
于是可建立灰微分方程 转化为白化微分方程
记
4
则由最小二乘法,求得使 达到最小值的
(8)
于是可求解白化微分方程(7)得到预测值为
(9)
且
3.4.3 预测值检验 3.4.3.1 残差检验
计算残差值
如果残差
则可认为预测结果达到一般要求; 如果残差
则可认为预测结果达到较高要求;
3.4.3.2 级比偏差值检验
计算级比偏差
如果级比偏差
则可认为预测结果达到一般要求; 如果级比偏差
则可认为预测结果达到较高要求;
利用Excel计算得到级比偏差检验数据(详细计算结果如表5(详细数据见附件9)所示),从学期2到学期4三个学期的级比偏差均值为依次为0.0093441、-0.02402和0.0119905,表明绝大部分级比偏差值都满足
因此,可以说模型的预测结果能达到较高的要求。
5
4. 模型的建立与求解
4.1 学生成绩整体情况的总体分析
4.1.1 对学生成绩的描述统计分析及结果说明
本文采用统计学中描述统计的方法对学生总体成绩的原始数据进行详细分析,得到了学生成绩的基础数据,如表1所示:
表1 学生成绩整体情况的描述统计
学期1成绩 学期2成绩 学期3成绩 学期4成绩 总数 612 612 612 612 均值 72.55 74.37 73.17 75.06 中值 74.32 76.64 74.19 76.54 众数 59.48* 78.33* 83.24 16.50* 标准差 9.50 10.60 9.01 10.24 方差 90.25 112.31 81.24 104.90 偏度 -1.24 -1.92 -1.94 -2.93 偏度的标准误 0.10 0.10 0.10 0.10 峰度 2.50 7.04 8.14 14.48 峰度的标准误 0.20 0.20 0.20 0.20 极小值 24.34 0.00 16.25 0.00 极大值 89.45 90.85 90.62 89.63 25 67.94 69.44 68.89 70.95
百分
50 74.32 76.64 74.19 76.54
位数
75 79.41 81.85 79.20 81.55
(其中* 表示存在多个众数,显示最小的)
从描述统计结果可以知道,由于偏度值都为负值,因此可以判断学生每个学期的总体成绩分布都属于负偏态分布,即其波峰偏向于成绩较高的右侧,说明学生的总体成绩偏向于高分,且每个学期的偏度值的绝对值逐渐增大,因此偏态程度越来越严重。峰度值为正值,且每个学期逐渐增大,说明高分层的学生数量逐渐增多。均值分数都在72-76分之间,可以判断学生的总体成绩状况良好。极大值普遍保持在90分左右,说明高分层波动不大。
为了更直观地观测成绩分布情况,作出学生成绩波动图:
6
图1 学生成绩波动图
从图1可以清楚地看到,学生成绩基本分布在七八十分之间。不过仅仅以此图进行分析说明过于笼统,因此为了更精确地刻画成绩分布,本文依据现实情况,把学生成绩按照如下评定方法划分为四个等级:
I. 90-100分 优 II. 75-90分 良 III. 60-75分 中 IV. 60分以下 差
据此可以做出成绩等级饼状分布图:
图2 成绩等级饼状分布图
从图2可以准确地知道,90%以上的学生成绩都集中在良和中(即60-90分)两个等级之间,其中等级为良的人数占46%-57%,等级为中的人数占35%-48%,而差评的学生为数不多,在4%-10%之间。然而成绩占优的学生比率非常低,且第一和第四学期一个都没有。具体数值如图3所示:
7
图3 成绩等级分布柱状图
综合以上,可以总结出学生成绩整体情况的分析说明: A. 学生总体成绩分布属于负偏态分布; B. 学生总体成绩良好;
C. 绝大多数学生成绩分布在60-90分之间;
D. 90分以上的学生数量甚少,每学期只有1-2个,有两个学期甚至一个都没有。 E. 差评的学生为数不多,平均每学期只有43个,占总人数的6.9% 4.1.2 对结论的检验
首先,本文采用非参数检验方法Kolmogorov-Smirnov检验(D检验)和Shapiro- Wilk检验(w检验)两种方法进行检验,运用SPSS计算得到表2,如下:
表2 正态性检验
Kolmogorov-Smirnova Shapiro-Wilk
学期
统计量 df Sig. 统计量 df Sig. 学期1成绩 0.079 612 0.000 0.926 612 0.000 学期2成绩 0.098 612 0.000 0.869 612 0.000 学期3成绩 0.076 612 0.000 0.876 612 0.000 学期4成绩 0.110 612 0.000 0.774 612 0.000 a. Lilliefors 显著水平修正 根据表2可知,D检验和W检验的显著性水平Sig.都极小,小于0.05,因此可以判定为非正态分布。
然后,分别利用SPSS绘制直方图、Q-Q图以及箱式检验图对结果进行正态性检验,如图4、图5和图6(清晰效果图请查看附图1-附图12)所示:
8
图4 成绩频次直方图
从图4 可以直观地看出,波峰偏向于右侧,而正态曲线长尾向左侧延长,因此,可以判定学生成绩的总体分布并不服从正态分布,而是负偏态分布。
图5 成绩标准Q-Q检验图
从图5可以直观地看出,只有少部分数据集中在y=x直线上,而大部分数据都偏离了此直线,因此可以判定,该分布为非正态分布,且数据偏向y=x直线的左上方,因此可以推断负偏态分布的结论是正确的。
9
图6 成绩箱式检验图
在图6的箱式检验图中,方框中的区域表示50%的数据所处的范围,方框的上线边界代表了四分位数间距,方框中间的粗线表示中位数,而方框以外的上下两条横线分别代表了极大值和极小值。如果观测数据服从正态分布,那么50%的数据应该落在纵轴中间位置。从图6可以明显地观察到,方框处于纵轴片上位置,因此可以判定学生成绩分布为非正态分布,且为负偏态分布。 4.2 k-均值聚类分析评价模型
4.2.1 确定分类数K
虽然从理论上说,分类的多少并不会对结果的合理性产生较大影响,但是会对结果的精确程度造成一定程度的影响。因此,虽然k-均值聚类分析可以事先给定分类数目,但是为了使分类结果更为精确合理,本文根据统计学中损失函数的原理,利用Matlab编写了分类损失函数并画出图像(代码见附录二),通过观察图像来确定合理的分类数。分类损失函数图像如图7所示:
图7 分类损失函数图像
由于计算数值太多,因此图7显示的图像过于粗糙。由于左侧图像节点比较稀疏,
10
而其他地方比较光滑稠密,因此选取左侧图像进行放大查看,如图8所示:
图8 放大后的损失函数图像
从图8可以看出,曲线在纵轴4.4-5.2之间有少许拐点,因此,放大后分别对纵轴4.4-4.8以及纵轴4.8-5.2之间的图像进行再次放大,如图9所示:
图9 放大后的损失函数图像
从图9可以清楚地看到,大约在纵轴4.6和4.8处以及纵轴4.0和5.1处,图像有四个明显的拐点,因此分类数K取为4或者5都是合适的。由于图像上的观测数值稍偏向于5,因此本文选取K值为5,即分为5类进行聚类。 4.2.2 利用SPSS进行快速聚类分析
以612名学生四个学期的成绩数据为聚类变量,聚类数为5,迭代10次,运行SPSS进行聚类计算的结果如表3-表5所示,其中表6为最终的分类情况(由于篇幅有限,只列出部分数据,详细数据见附件17):
表3 最终聚类中心
1 2 3 4 5 学期1成绩 70.12173 79.43517 58.4838 57.21686 38.42292 学期2成绩 72.8839 81.47749 57.86058 57.82471 18.32652 学期3成绩 70.48539 79.39345 63.78376 46.91419 19.46546 学期4成绩 72.61679 81.39656 67.13915 22.67073 21.21012 均值 71.5270 80.4257 61.8168 46.1566 24.3563 从聚类中心可以看出,五个类别的聚类中心均值分别为71.5270、80.4257、61.8168、46.1566和24.3563。因此可以根据此结果把学生的状况分为5个类别,依次是:学习状况良好、学习状况很好、学习状况一般、学习状况勉强以及学习状况差。
表4 每个聚类中的案例
11
聚类 总数 有效个数 缺失
1 231 231 0 2 286 286 0 3 84 84 0 4 8 8 0 5 3 3 0 总计 612 612 0 从表中数据可以看出,处于类别1(学习状况良好)和类别2(学习状况很好)的学生数量占了绝大部分比率,与负偏态分布的结论相吻合,说明分类具有合理性。
表5 聚类成员(部分数据)
学生序号 学期1 学期2 学期3 学期4 均值 聚类 6 78.2750 65.2946 76.0400 72.4900 73.0249 1 7 76.3250 75.4929 63.4350 66.5050 70.4395 1 9 69.1500 76.3571 71.0550 73.6400 72.5505 1 ? ? ? ? ? ? 1 599 72.5833 77.1852 73.2632 76.4500 74.8704 1 601 81.4583 78.3333 68.9737 71.7000 75.1163 1 603 75.3958 76.4815 74.0263 75.3500 75.3134 1 607 74.5208 72.4815 75.2632 72.6000 73.7164 1 612 55.1875 73.2963 69.5000 73.7000 67.9209 1
均值 72.3594 74.3269 70.8687 72.9383 72.6233
聚类中心 70.1217 72.8839 70.4854 72.6168 71.5270
1 79.0000 74.8250 74.2900 76.9800 76.2738 2 2 75.6250 73.4036 80.5913 74.8450 76.1162 2 4 82.7500 83.2039 76.5066 80.8700 80.8326 2 5 76.1000 83.1161 77.5755 83.2950 80.0216 2 ? ? ? ? ? ? 2 610 80.6042 80.2222 81.4211 80.5500 80.6994 2 611 86.4792 87.2593 76.8158 86.4500 84.2511 2
均值 77.6142 80.5289 76.9848 81.1040 79.0580
聚类中心 79.4352 81.4775 79.3935 81.3966 80.4257
3 62.1203 59.2143 68.5019 68.8650 64.6754 3 18 53.5000 52.3714 63.2850 63.6150 58.1929 3 28 63.9000 56.8786 60.1300 56.9900 59.4746 3 468 57.2653 59.2381 76.4000 79.3182 68.0554 3 ? ? ? ? ? ? 3 500 54.8750 67.1852 64.9211 70.0000 64.2453 3 514 51.2083 56.3333 65.1842 66.3000 59.7565 3 543 42.4792 71.4074 69.8158 74.0976 64.4500 3 544 53.1250 73.0741 58.7895 74.1500 64.7846 3
均值 54.8091 61.9628 65.8784 69.1670 62.9543 聚类中心 58.4838 57.8606 63.7838 67.1391 61.8168 12
8 60.9500 58.2321 55.9009 16.5000 47.8958 43 60.5000 47.2071 56.5050 16.5000 45.1780 62 59.4750 55.7143 57.0200 16.5000 47.1773 67 50.7000 44.0768 46.0321 36.8100 44.4047 273 49.6800 56.9464 38.2326 17.5946 40.6134 288 49.3673 63.9394 24.2963 0.0000 34.4008 557 68.6875 70.7407 64.9737 27.6279 58.0075 595 58.3750 65.7407 32.3529 49.8333 51.5755 均值 57.2169 57.8247 46.9142 22.6707 46.1566 聚类中心 57.2169 57.8247 46.9142 22.6707 46.1566
141 40.9500 28.6545 22.0526 19.4302 27.7719 222 24.3438 0.0000 16.2500 19.1351 14.9322 242 49.9750 26.3250 20.0938 25.0650 30.3647 均值 38.4229 18.3265 19.4655 21.2101 24.3563 聚类中心 38.4229 18.3265 19.4655 21.2101 24.3563
4 4 4 4 4 4 4 4
5 5 5
结论:大部分学生的学习状况良好,而少数学生的学习状况一般。值得注意的是,有11个学生处于危险的学习状况下,其中3个其四学期的平均分只有24.3563分,在百分制中属于极差的状况,需要引起高度重视。 4.3 成绩预测的灰色系统预测模型
灰色预测通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。灰色预测是指利用GM模型对系统行为特征的发展变化规律进行估计预测,同时也可以对行为特征的异常情况发生的时刻进行估计计算,以及对在特定时区内发生事件的未来时间分布情况做出研究等等。这些工作实质上是将“随机过程”当作“灰色过程”,“随机变量”当作“灰变量”。本文采用的是灰色系统理论中的GM(1,1)模型。
4.3.1 灰色建模可行性检验:对原始数据进行预检验与预处理
为了保证建模方法的可行性,需要对已知数据列做必要的检验处理。 设第i个学生第j个学期的成绩为
(1)
计算数列的级比
(2)
如果所有的级比
都落在可容覆盖
13
,即(0.67032,1.39561)(在本文
中,)范围内,则数列可以作为灰色模型GM(1,1)的数据进行灰色预测。否则,需要对数列做必要的变换处理,使其落入可容覆盖内。即取适当的常数C,作平移变换
则使数列
的级比为
(3)
由于有两个成绩为0的数据,因此在计算级比时,统一将其当作缺失值并做替换处理(用该学生成绩非0的其他几门成绩的均值代替),由于数据量极少,因此不影响整个模型的计算结果。之后运用Excel进行计算后得到每个学生的级比,并对其进行比较判断后证实所有数据均落在可容覆盖范围内(详细数据见附件6)。三个级比的均值依次为0.985193、024020066和0.988009465。
因此学生成绩可以进行灰色模型GM(1,1)的数据进行灰色预测。 4.3.2 建立GM(1,1)灰色模型
对数列
做一次累加生成1-AGO数列:
其中,
(4)
均值数列 则
(5)
于是可建立灰微分方程
(6)
转化为白化微分方程
(7)
记为
则由最小二乘法,求得使 达到最小值的
于是可求解白化微分方程(7)得到预测值为
14
(8)
(9)
且
其中的待求参数a和b则由公式(8)计算得到第i个学生待求参数和。 将和代入方程(9),可得预测方程为
(10)
依据预测方程(10),写出Matlab代码(代码见附录一)即可计算每个学生第5、6学期的成绩预测值。而当时,模型计算得出的是前四个学期的成绩拟合值。 3.4.4 预测值检验 4.3.4.1 残差检验
计算残差值
如果残差
则可认为预测结果达到一般要求; 如果残差
则可认为预测结果达到较高要求;
利用Excel计算得到残差检验数据(详细计算结果如表4(详细数据见附件9)所示),前四个学期的残差均值为依次为3.87665E-15、0.007174、-0.02019和0.009094,表明绝大部分残差值都满足
因此,可以说模型的预测结果能达到较高的要求。
表6 残差检验
序号 学期1 学期2
1 0 0.00727 2 0 -0.02965 3 6.8629E-16 -0.0276 4 0 0.021814 5 -7.65631E-14 0.022604 6 -1.0893E-15 -0.03859 ? ? ? 606 -2.45435E-15 0.040417 607 8.9055E-14 -0.01253 608 -1.28875E-15 0.012519 609 0 0.021155 610 7.93371E-15 -0.00431 611 7.39473E-15 0.038155
15
学期3
-0.01438 0.053528 0.045447 -0.04809 -0.04838 0.063556
? -0.0971 0.024116 -0.02521 -0.04177 0.008476 -0.08711 学期4 0.006867 -0.02854 -0.02037 0.023116 0.022505 -0.03145
?
0.044616 -0.01249 0.011835 0.018548 -0.00427 0.038898
612 极大值 极小值 均值 3.11574E-14 8.9055E-14 -7.65631E-14 3.87665E-15 0.018233 0.040417 -0.03859 0.007174 -0.03835 0.063556 -0.0971 -0.02019 0.01803 0.044616 -0.03145 0.009094
4.3.4.2 级比偏差值检验
计算级比偏差
如果级比偏差
则可认为预测结果达到一般要求; 如果级比偏差
则可认为预测结果达到较高要求;
利用Excel计算得到级比偏差检验数据(详细计算结果如表5(详细数据见附件9)所示),从学期2到学期4三个学期的级比偏差均值为依次为0.0093441、-0.02402和0.0119905,表明绝大部分级比偏差值都满足
因此,可以说模型的预测结果能达到较高的要求。
表7 级比偏差检验
学生序号 学期2 学期3
1 -0.063453 -0.007202 2 -0.035017 0.0891871 3 -0.088233 0.1355817 4 0.0128062 -0.087539 5 0.0838972 -0.071422 ? ? ? 607 -0.028557 0.0369637 608 -0.000503 -0.023485 609 0.0887206 -0.028807 610 -0.005779 0.0147259 611 0.011432 -0.135948 612 0.245978 -0.054619 极大值 0.5780174 0.7088546 极小值 -2.235521 -1.631668 均值 0.0093441 -0.02402 3.4.5 成绩预测结果
根Matlab的计算结果得到前四个学期的拟和成绩和第五六学期的预测成绩,如表6(详细数据见附件7)所示,这里只列出部分数据:
表8 前四个学期的拟和成绩以及后两个学期的预测成绩
16
学期4 0.0349441 -0.076776 0.0052728 0.0539557 0.0686659
?
-0.03668 0.0497997 0.0892973 -0.010813 0.1114401 0.0569878
0.5404 -2.455758 0.0119905
序号 学期1 学期2 学期3 学期4 学期5 学期6 1 79 74.28105 75.35839 76.451 77.5559 78.6851 2 75.625 75.57985 76.27738 76.981 77.6906 78.4088 3 62.12031 60.84837 65.38867 70.267 75.4345 81.1452 4 82.75 81.38893 80.18587 79.000 77.8277 76.6823 5 76.1 81.23729 81.3288 81.420 81.5121 81.6040 ? ? ? ? ? ? ? 606 75.271 82.52417 80.40565 78.341 76.3127 74.3709 607 74.521 73.38923 73.44798 73.506 73.5656 73.6245 608 77.188 76.73123 77.83489 78.954 80.0856 81.2420 609 69.875 76.3499 78.98251 81.705 84.4955 87.4376 610 80.604 80.56773 80.73086 80.894 81.0580 81.2223 611 86.479 83.92966 83.50739 83.087 82.6685 82.2533 612 55.188 71.95959 72.16508 72.371 72.5777 72.7851 极大值 89.45 89.7217649 88.88720 88.573 121.4161203 184.4182048 极小值 24.34375 18.8431815 18.42744 18.020 12.46689697 7.505105619 均值 72.55267 73.9235764 74.13855 74.616 75.36097283 76.39383968
其中后两个学期的极大值出现异常,为了准确地找出异常值,以第五学期为主要关键字,第六学期为次要关键字对预测结果进行排序,结果如表7所示:
表9 对第五六学期预测成绩排序后的结果
学生序号 学期1 学期2 学期3 学期4 学期5 学期6 49.6800 57.1430 34.4002 20.7090 12.4669 7.5051 273 40.9500 28.1524 22.9959 18.7838 15.3433 12.5329 141 24.3438 18.8432 18.4274 18.0209 17.6233 17.2345 222
? ? ? ? ? ? ?
82.4790 77.5616 81.9690 86.6268 91.5493 96.7515 575
76.6730 75.2519 80.3982 85.8965 91.7708 98.0469 319
71.4490 66.2493 74.1560 83.0063 92.9128 104.0017 282
57.2650 62.1179 71.1230 81.4337 93.2390 106.7558 468
56.5100 44.7196 58.1344 75.5733 98.2434 127.7141 301
40.0000 31.9959 46.8560 68.6178 100.4867 147.1567 348
36.6040 40.9471 55.2672 74.5953 100.6828 135.8937 387
54.9800 44.5643 58.7419 77.4298 102.0631 134.5331 346 52.3510 34.6493 52.6286 79.9372 121.4161 184.4182 307 从表7可以方便地看到,第五学期348、387、346、307号学生以及第六学期282、468、301、348、387、346、307这几位同学的成绩超出了100分,且307同学第六学期的分数值超过了180分。出现此问题主要是因为级比值过低,即成绩逐学期递增的趋势偏大,其级比均值为0.84742371,而其他学生的级比均值为0.997654299,两者相差0.150230589,导致在预测的时候超出100分。模型在计算的时候并未就预测值做范围限制,且100分制的成绩模式属于现实世界中的人为规定,并不能为灰色预测模型所识别,因此也没有必要对此做限制。
17
3.4.6 成绩预测结果检验
4.3.6.1 对预测成绩的正态性检验如下:
表10 正态性检验
学期 Kolmogorov-Smirnova
统计量 0.079 0.093 0.079 0.099 0.111 0.103 df 612 612 612 612 612 612 Shapiro-Wilk
Sig. 统计量 df Sig. 学期1成绩 0.000 0.926 612 0.000 学期2成绩 0.000 0.905 612 0.000 学期3成绩 0.000 0.882 612 0.000 学期4成绩 0.000 0.823 612 0.000 学期5成绩 0.000 0.849 612 0.000 学期6成绩 0.000 0.862 612 0.000 根据表7可知,D检验和w检验的显著性水平Sig.都极小,小于0.05,因此可以判定为非正态分布。
4.3.6.2 图示法检验
运用直方图、标准Q-Q检验图和箱式检验图(清晰图片见附图13-附图18)对预测成绩进行检验如下:
图10 预测成绩频次直方图
从图7 可以直观地看出,在100分以内的成绩分布中,两个学期的波峰偏向于右侧,而正态曲线长尾向左侧延长,因此,可以判定学生成绩的总体分布并不服从正态分布,而是负偏态分布。
而学期六的波峰直接看起来稍微偏向于左侧,这是因为GM预测模型的预测值有极少量数据偏大,在作图时并未剔除这几个数据。如果仔细观察图7中的右图可以发现,成绩大于100分的数据只有极少量,因此,如果剔除这些数据后作图可以得到准确的负偏态分布图。
18
图11 预测成绩标准Q-Q检验图
从图8可以直观地看出,在100分值范围内,只有少部分数据集中在y=x直线上,而大部分数据都偏离了此直线,因此可以判定,该分布为非正态分布,且数据偏向y=x直线的左上方,因此可以推断负偏态分布的结论是正确的。
类似于直方图,曲线的中心稍微偏向于左侧,是因为并未剔除极少量的偏大数据。
图12 预测成绩箱式检验图
从图9中可以明显地观察到,在100分值范围内方框处于纵轴偏上位置,因此可以判定学生成绩分布为非正态分布,且为负偏态分布。
而图9中的右图方框稍微偏向于下方,也是由于在作图时并未剔除极少数的偏大数据。
综合以上各种检验方法,可以得出结论:
利用灰色GM(1,1)预测模型计算得到的预测数据是合理可靠的,具有较高的可信度。 4.4 给学校管理部门的建议
学生成绩是学生学习状况的直接反映,在衡量学生知识水平、教师教授水平、学校教学管理等方面具有重要意义,因此对学生的考试成绩进行分析研究对学校的教育能力、学生的学习水平具有现实意义。我们运用统计学的相关原理和工具对612名学生四个学期的成绩进行分析后,给出了如下几条建议,望学校领导重视:
一、学生成绩呈正态分布并非合理论断。目前主流的观点认为,学生的成绩分布应该呈现正态分布,然而本文对612名学生的成绩经过科学地统计分析后发现,这些学生的成绩分布并不是正态分布,而是大多数成绩偏向于高分值的负偏态分布。我们结合现实情况,对此结果做了细致思考,得出以下结论:
1.影响学生成绩高低的因素是多方面的,老师们在对学生成绩作评价的时候应该根据实际情况进行分析;
19
2.影响考生成绩高低的因素主要有两个方面:考试题目的难度对学生成绩的影响很大,学生自身的知识水平对考试成绩的影响也很大。
因此,如果在对考试成绩进行统计分析后发现其分布呈现负偏态分布,则说明考生成绩偏向于高分值。在这种情况下,首先应该对试题难度进行合理论证,如果难度偏低,则说明成绩分布是合理的;如果难度偏高,则说明学生自身的知识水平很高;如果难度适中,则说明考生自身的知识水平比一般水准稍高。
反之,如果考试成绩呈正偏态分布,则说明考生成绩偏向于低分值。在这种情况下,同样先要对试题难度进行合理论证,如果难度偏低,则说明学生自身的知识水平较低;如果难度偏高,则说明成绩分布是合理的;如果难度适中,则说明考生自身的知识水平比一般水准稍低。
当然,成绩分布具体的合理程度以及考生的具体水平如何主要取决于曲线分布的偏度值、成绩的均值。因此如果学校领导们需要对考试成绩和学生们的学习状况作详细的分析研究,应该综合运用统计学的原理和相关工具进行建模分析,甚至可以找专门统计分析师进行科学分析。
二、优秀率和差评率过低必须引起高度重视。一般认为,分数大于90分则为优。而分数小于60分则为差。倘若学生成绩的优秀率极低,甚至为0,在排除试题难度超常甚至严重超纲的情况下,无论如何具有不合理性。因为无论是正态分布还是偏态分布,极高的出现都是必然的。同理,差评率也是如此,极差的出现也都是必然的。因此,在出现此状况后,需要对试题难度进行合理论证,必要情况下还需要对近期的教学情况进行考察和调研。
三、优秀率和差评率过高也必须引起高度重视。因为无论是正态分布还是偏态分布,极高值和极低值机不可能大量出现,否则必定是有问题的。
四、标准偏差过大从侧面反映了学习状况存在众多不稳定因素。这些不稳定因素可能包括学生的情绪和心理状况不稳定,教育策略存在偏向性(教师偏向于教授某知识点或者偏向于某学生等)。
五、对于极差的个别学生,应该单独对他们进行沟通以找出他们成绩差的原因所在,进而对这些学生加强思想引导,增加学习压力,充分调动他们的学习能动性和积极性。
5. 模型的推广
模型三的改进与推广
在现实中,考试成绩无论是以原始分计算还是以标准分计算,都有一个范围限制,比如原始分,通常是采用百分制。而GM(1,1)模型在建立时并不能对预测结果的范围进行限制,因此很可能会出现预测结果超出上限的情况。考虑改进模型,使其能够根据实际情况限制预测结果的上下限。对模型进行研究后发现主要可以从两个方面对模型进行修改:
1、 改进级比数列的计算方法,添加上限平衡因子对每一个级比进行平衡运算,以增大较低的级比值。
2、 在预测函数中添加限定条件,只要预测值超出上限,就将其修改为上限值再输出。
这两种方法在技术上都是可行的,然而方法一在计算上过于复杂,在技术上主要有以下两个难点:一是添加平衡因子后不能对正常的级比值造成影响;二是平衡因子的
20
计算难度过大。
为了解决这个问题,我们考虑这样处理:
首先根据计算出所有的级比数列,然后计算其均值,最后把所有的级比值与该均值进行比较,如果低于改值,则将该数据当作缺失值处理。这样做虽然会产生一定的误差,但是考虑到预测结果超出常值的数据数量所占比率很低,并不影响整体,所以据此改进后的模型依然是可行的。
而对于方法二,其原理简单,计算也容易。更重要的是,用此方法修改模型后的预测结果同样具有合理性。因为虽然预测结果超出了上限,但是同时也说明该数据已经达到最佳值或者最低值,比如成绩数据,既然预测值超出了100分,那么说明该学生的水平也达到了最佳值。具体流程如下:
因此可以采用方法二进行模型的改进。在添加了限制条件后,模型的适用性就增强了,应用范围也扩大了很多。因此对于模型的推广具有实际意义。
参考文献
[1] 张兴福,统计学原理,北京:北京大学医学出版社,北京大学出版社,2010年 [2] 杜强,贾丽艳,SPSS统计分析从入门到精通,北京:人民邮电出版社,2009年 [3] IBM,IBM SPSS Statistics 19用户指南,北京:IBM,2010年
[4] 百度百科,灰色预测,http://baike.http://www.32336.cn//view/414153.htm,2011年8月
15日
[5] 豆丁网,灰色预测模型及其应用,http://www.docin.com/p-82209940.html,2011
年8月15日
附录
附录一:预测学生成绩的Matlab代码 %GM(1,1)
%?ó|ì=[(a,b)]^T=[(B^T*B)]^(-1)*B^T*Y ?Dμ?a,b
21
clear all;
%?áè?êy?Y
B_tmp = xlsread('???t7GM(1,1)êy?μ′|àí.xls','B???ó','B2:D613'); Y_tmp = xlsread('???t7GM(1,1)êy?μ′|àí.xls','Y???ó','B2:D613'); %?áè??????§éúμúò??§?úμ??-ê?3é?¨
x = xlsread('???t7GM(1,1)êy?μ′|àí.xls','?′êy?Y','B2:B613'); %?áè??????§éúμ?1-AGO3é?¨êy?Y
AGO = xlsread('???t7GM(1,1)êy?μ′|àí.xls','1-AGO','B2:E613'); n = size(Y_tmp); %n = [612,3]
%?¤2a?????§éúμ?3é?¨ for i = 1 : n(1)
%°?ê?è?μ?êy?Y×a???aB???óoíY???ó for j = 1 : n(2) B(j,1) = B_tmp(i,j); B(j,2) = 1;
Y(1,j) = Y_tmp(i,j); Y(1,j) = Y_tmp(i,j); Y(1,j) = Y_tmp(i,j); end
%????B???óμ?×a?????ó B_T = B';
%????Y???óμ?×a?????ó Y_T = Y';
%????B_T*Bμ??????ó B_inv = inv(B_T*B); %????B_inv*B^T*Y u = B_inv*B_T*Y_T;
%?óμ?a,b a(i) = u(1); b(i) = u(2); end
%?¤2aμúi???§éúμú5?¢6?§?úμ?3é?¨ for i = 1 : n(1) for j = 5 : 6
AGO(i,j) = (x(i)-b(i)/a(i))*exp(-a(i)*(j-1))+b(i)/a(i); end
for j = 5 : 6
ex(i,j-4) = AGO(i,j) - AGO(i,j-1); end end
22
%°??¤2a?á1?D′è?Excel
xlswrite( '???t8?§éú3é?¨?¤2a?á1?.xls',ex );
附录二:分类损失函数的Matlab代码 %cluste_lost clear;
%?áè??????§éúμúò??§?úμ??-ê?3é?¨
F = xlsread('???t7GM(1,1)êy?μ′|àí.xls','?′êy?Y','B2:B613'); F = F./100; D=zeros(612,612); for i=1:611 for j=2:612 if(i sx=sx+F(t);%????X???óμ?×üoí end meanx=sx/(j-i+1);%?????ù?μ?′×óààμ?êy?Y??D? for k=i:j d=d+(F(k)-meanx).^2;%?????÷??×óààμ??±?? end D(j,i)=d;%??????3?à′μ??±??′?μ?D???ó?D end end end LP=zeros(612,611); J=zeros(612,611); for k=2:611 for l=3:612 if k if k==2 %k=2ê±μ?×?D??eê§oˉêy for j=2:l temp=D(j-1,1)+D(l,j); if(temp else %k>2ê±μ?×?D??eê§oˉêy 23 for j=k:l temp=LP(j-1,k-1)+D(l,j); if temp LP(l,k)=min;%??·?2??eê§oˉêy′?è?LP J(l,k)=minj; end end end for m=1:610 p(m)=LP(612,m+1); end k=2:611; plot(k,p,'-*') 24