人口预测与数据拟合 下载本文

人口预测与数据拟合

1、摘要:

随着人口的增加,人们越来越认识到资源的有限性,人口与资源之间的矛盾日渐突出,人口问题已成为世界上最被关注的问题之一。

问题给出了1790—2000年间美国的人口数据,通过分析近两百年的美国人口统计数据表,得知每10年的人口数和人口增长率的变化。预测美国未来的人口。

首先,人口增长率是变化值。对于问题(1)假设了人口上限因此我们选择建立Logistic模型(模型1)

其次,根据表中的人口数据,进行曲线拟合(模型2),通过Matlab进行人口预测。

关键词:预测模型 人口增长率 Logistic 2、实验问题:

1970年到1980年间美国人口数的统计数据如表所示 年1790 1800 1810 1820 1830 1840 1850 1860 1870 1880 份 统3.9 5.3 7.2 9.6 12.9 17.1 23.2 31.4 38.6 50.2 计 年1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 份 统62.0 72.0 92.0 106.5 123.2 131.7 150.7 179.3 204.0 226.5 计 (1) 根据表中的数据,分别用不同次数的多项式拟合美国人口数量增长的近似曲线图。

(2) 根据表中的数据,建立符合Malthus模型的美国人口数量增长曲线模型。 (3) 设美国人口总体容量为4.5亿,试用Logistic模型建立美国人口增长曲

线模型。

(4) 分别用上述三种方法预测2000年,2005年,2015年,2020年美国人口

数量,并对不同方法的预测结果进行比较分析。 3、实验问题的分析:

根据以上问题的提出我们可以通过两种模型来进行求解,Malthus模型和Logistic模型来预测美国人口数量和统计的结果的差别。Malthus模型:1798年,英国统计学家Malthus在在进行大量统计的基础上发现了一种关于生物种的繁殖规律,就是一种个体数量的增长率与该时刻种群的个体数量成正比。有效地控制人口的增长,认识人口数量的变化规律,建立人口模型,做出较准确的预报,是有效控制人口增长的前提。

整个模型的过程中应当包括:人口增长的变化规律;人口数量的死亡的变化规律;人口平均生育的变化规律;统计人口是的过程等。 人口预测是一个相当复杂的问题,影响人口增长除了人口数与可利用资源外,还与医药卫生条件的改善,人们生育观念的变化等因素有关……. 可以采取几套不同的假设,做出不同的预测方案,进行比较。

人口预测可按预测期长短分为短期预测 (5年以下)、中期预测(5~20年)和

长期预测(20~50年)。在参数的确定和结果讨论方面,必须对中短期和长期预测这两种情况分开讨论。中短期预测中所用的各项参数以实际调查所得数据为基础,根据以往变动趋势可较准确加以估计,推算结果容易接近实际,现实意义较大。

4、 实验模型的假设:

(1)、人口数量在某一年内增长的速度较快,在哪一年内不记人口的死亡人数,和种种影响人口增长的因素。 (2)、假设美国人口上限为5亿,根据表中给出的人口增长率,进行适当的处理,建立微分方程模型; (3)、 利用 (2) 中的模型计算各年人口,与实际人口数量比较,计算模型的计算误差; (4)、 利用(2)中的模型预测美国2010,2020,2030,2040,2050年的人口; (5)、 假设人口增长率服从[1.1,1.3]上的均匀分布,结合 (2) 中建立微分方程模型,预测美国2010,2020,2030,2040,2050年的人口. 5、 模型的建立:

模型1

图1为1790-2000年的人口数据,人口增长率r为每10年的取值。首先对人口增长率进行处理求出其他年份相对于1790年的增长率R

Rtn=rt1+.....+rtnn

其中t1=1800年….. t21=2000年(10.最大人口数量Xm=500 当x=Xm时增长率为零。在线性化假设前提下可以得到 r(x) = r (1 – x / Xm),(公式1)

其中的r我们取之前求得的平均增长率r=0.0264 , Xm=500。在公式1假设下,模型可修改为

骣dxx÷?=rx(1-)÷??dtxm÷÷ (公式2) ?÷?÷?÷÷?x(0)=x0桫上述方程改为Logistic模型

x(t) =xm/1+(xm/x0-1)e-rt (公式3)

e取2.718,t为Dt,求出每10年的rt值带入方程算出各年的人口数以 及和实际值的误差见图3。

2010年的R*t=5.808,预测人口为362.32; 2020年的R*t=6.072,预测人口为387.59; 2030年的R*t=6.336,预测人口为408.16; 2040年的R*t=6.6 ,预测人口为427.35; 2050年的R*t=6.864,预测人口为442.48;

观察预测结果1930年以前只有1800 1810 1820误差较小,其它年份误差正负都稍微偏大,1940年以后预测值逐年大于实际值,说明在给定最大人口数后增长率选择不适当,与给定的最大人口数不匹配,有待改进。

图(1) 图(2)

图(3)

模型2

(1) 根据表中的人口数据,进行曲线拟合,建立数学模型;

(2) 利用 (1) 中的模型计算各年人口,与实际人口数量比较,计算模

型的计算误差;

(3) 利用 (1) 中的模型预测美国2010,2020,2030,2040,2050年的人口;

利用MATLAB进行曲线拟合,首先在平面上绘出已知数据的分布图,通过直观观察,猜测人口随时间的变化规律,再用函数拟合的方法确定其中的未知参数,从而估计出2010 2020 2030 2040 2050年的美国人口。利用MATLAB作出美国人口统计数据的连线图如图4。

图4 美国人口统计数据连线图

图5 建模方法1的拟合效果图

由图4可以发现美国人口的变化规律曲线近似为一条指数函数曲线,因此我们假设美国的人口满足函数关系x=f(t), f(t)=ea+bt,a, b为待定常数,根据最小二乘拟合的原理,a, b是函数E(a,b)??(f(ti)?xi)2的最小值点。其中xi是

i?1n