摘要
社会的飞速发展使得人们的生活水平有很大的提高,家家丰衣足食避免了过去闹饥荒,饿死人等现象,但正是因为这样,使得人口不受,带来了诸如就业压力增大等问题。今天我们就这人口话题进行预测分析。本题要求对人口做中短期与长期预测。我们可以从人口分布、数量、结构进行考虑。
对于人口分布与数量预测,建立微分方程,借鉴人口发展方成模型。根据人口净增长率=出生率-死亡率,且出生率=各年市、镇、乡的女性比率与育龄妇女生育率的乘积之和,死亡率=各年男性比率男性死亡率+女性比率女性死亡率,求出2001—2005年城市、镇、乡三种类型的人口净增长率。我们曾考虑分别采用灰色系统,多元逐步回归,时间序列分析等三种方法对三种类型的人口进行净总人口增长率的预测。但是,通过比较分析得知在这三种方法中,灰色系统预测效果最好。
对于人口结构预测,我们采用灰色系统对老龄化比例、劳动力、育龄妇女所占比重以及生育率预测,采用二次逐步拟合的方法对出生人口性别比例进行预测。通过EXCEL计算,各年市、镇、乡各年龄组的男性比率与女性比率的总和在1附近。由于是统计数据,所以稍有偏差,以下我们可以近似认为男、女比率之和为1。
同理,运用多次逐步回归对城市和镇的老龄化人口占总人口的比率进行预测。同样采用灰色系统,通过MATLAB程序(附件2)得到2006年及2007年人口的预测值。
关键词
人口预测,MATLAB,数学建模
问题提出
1.对人口做中短期的预测。
2.对人口做长期的预测。
3.写出目前人口预测,并对未来的人口进行预测。
问题分析
预测的人口总量峰值在16亿左右,与这与我国提出的人口总量峰值控制在15亿左右的战略目标有一定差距,影响人口总数发展进程的因素有男女性别比、死亡率、生育率,而死亡率是很难控制的,因此国家应该以降低生育率来达到控制人口数量的目的。
5.3.2 控制方案确立
利用长期预测模型中的第一个模型进行修正,得出当国家把生育率控制在20.65‰-23‰左右时。人口峰值会在2043年出现,为15.1410亿。
模型的假设
1人口增长率与人口老龄化,男女性别比例,劳动力,生育率,育龄妇女所占比重有关。
2城乡对人口增长率的影响。
3根据目前人口数,推测未来人口会减少。
符号说明
人口密度函数定义:
出生率:
死亡率:
模型的建立于求解
中短期人口预测
模型预处理
首先,我们做如下处理:
第一,鉴于人口的增长率只有0岁婴儿的出生能够表示,我们将0岁婴儿分为一类。而育龄妇女的年龄分布为15—49岁,且20—29岁之间的生育率尤为高,之后在我国计划生育等制度的影响下,生育率有所控制,由此我们把这一期间的人口分为初始生育期、生育旺盛期、生育控制期三类。而老年人又有较高的死亡率,所以结合中国统计年鉴的分类标准,把65岁以上的人群定义为老年人。综上原因,我们把年龄段分为如下7部分: 定义0岁为婴儿期,1-14岁为幼年期,15-19岁为初始生育期,20-29岁为生育旺盛期;30-49岁为生育控制期;50-65岁为转向老年期;65岁以上为老年期。
第二,通过EXCEL计算,各年市、镇、乡各年龄组的男性比率与女性比率的总和在1附近。由于是统计数据,所以稍有偏差,以下我们可以近似认为男、女比率之和为1。
第三,本题要求对人口做中短期与长期预测。进行中短期预测时,由于在短时期内基本不变,人口数量、素质、结构、分布之间的关系不很明显,所以可以忽略它们之间的相互影响,采取以下方法进行预测。
其次,对于中短期人口的预测,我们从人口分布、数量、结构三方面考虑。
第一,人口数量我们采用人口发展方程模型,把针对人口数量的时间与年龄两个变量综合成一个变量,从而将二维微分方程转化为一维微分方程,大大改进并简化了模型。并且用人口增长率变化来反映人口数量的变化。
第二,人口分布的预测,我们进行人口城镇化比例的预测,采用灰色系统的方法。
第三,针对人口结构,我们又进一步从以下几个方面进行了预测:一,老龄化比例预测,我们采用灰色系统理论进行了预测。二,出生人口性别比预测,我们采用二次逐步拟合的方法进行预测。三,劳动力预测,即人口抚养比预测,我们采用灰色系统进行预测。
第四,育龄妇女所占比重的预测,我们同样采用灰色系统。第五,生育率预测,我们又采用二次逐步拟合。
人口数量与人口分布预测
人口数量预测的微分方程
题目所给数据量较少,运用时间序列进行预测需要大量的数据,不合适;而且预计未来某一时刻会有一个人口高峰值,因此运用灰色系统也不合理。因此我们转向考虑建立微分方程,借鉴人口发展方成模型,把以人口数量为因变量的两个自变量——时间与年龄综合成一个变量,从而将二维微分方程转化为一维微分方程,大大改进并简化了模型。并利用此求出各年的人口增长率,用人口增长率的变化来反映人口数量的变化。
我们引用人口发展方程,设是在第年、年龄小于的人口数,即人口分布函数。将人口密度函数定义为:, 表示时刻年龄在区间[]内的人数。记为时刻年龄的人的死亡率,其含义是:表示第年在内单位时间死亡的人数 。
为了得到满足的方程,考察第年、年龄在内的人到时刻的情况。他们中活着的那一部分人的年龄变为,这里。而在这段时间内死亡的人数为。
于是
设为第年龄段的人口数量百分比,即。对模型进行简化,将二维变量化为一维变量,即。在第年中,第年龄段的人口数量百分比为,从而将变量省去。
以第年为例,方程有一个定解条件:出生的婴儿数量占总人口百分比记作,称婴儿出生率。设女性性别比函数为,年龄在的女性人数为,将这些女性在单位时间内平均每人的生育数量记作,设育龄区为,则的直接含义是时刻单位时间内平均每个育龄女性的生育数。由此得到以下微分方程组:
这个连续型人口发展方程描述了人口的演变过程,但为进一步简化模型,设=1;即一岁为一个年龄段;将连续方程离散化。从这个方程确定出密度函数以后,立即可以得到各个年龄的人口比值(见附件1),即人口比值分布函数。
运用连续方程离散化的思想,利用等式:净人口增长率=出生率-死亡率,出生率即为,死亡率为,其中为第年龄段人口数量的比值(加权值),为相应年龄段的死亡率。
三种类型人口净增长率的求解
结合上述微分方程组,根据人口净增长率=出生率-死亡率,且出生率=各年市、镇、乡的女性比率与育龄妇女生育率的乘积之和,死亡率=各年男性比率男性死亡率+女性比率女性死亡率,求出2001—2005年城市、镇、乡三种类型的人口净增长率。
表1 2001-2005年市、镇、乡三种类型人口净增长率(单位:%)
年份
类型 | 2001 | 2002 | 2003 | 2004 | 2005 |
城市 | 4.6862 | 3.4502 | 2.9174 | 4.2779 | 3.5108 |
镇 | 6.3451 | 5.1742 | 5.7916 | 5.3374 | 4.0971 |
乡 | 5.6611 | 4.9072 | 4.9384 | 4.4701 | 2.9958 |
灰色系统是指部分信息已知而部分信息未知的系统,灰色系统理论所要考察和研究的是对信息不完备的系统,通过已知信息来研究和预测未知领域从而达到了解整个系统的目的。具有能够利用“少数据” 建模寻求现实规律的良好特 性,克服了资料不足或系统周期短的矛盾。
灰色系统GM(1,1)模型是依据系统中已知的多种因素的综合资料,按微分方程拟合去逼近,进而外推,达到预测的目的。这种拟合得到的模型是时间序列的一阶微分方程,因此,简记为GM(1,1)模型。
我们利用2002—2005年的实际值(3.4502,2.9174,4.2779,3.5108),通过MATLAB程序(见附件2)运行得到如下结果:
表2 2002-2005年GM(1,1)灰色系统预测值与实际值比较
年份 | 预测值 | 实际值 | 残差q | 相对误差ξ 1(%) |
2002 | 3.3142 | 3.4502 | -0.1360 | 3.9430 |
2003 | 3.4595 | 2.9174 | 0.5421 | 18.5818 |
2004 | 3.6112 | 4.2779 | -0.6667 | 15.5841 |
2005 | 3.770 | 3.5108 | 0.2588 | 7.3716 |
表3 各类型人口净增长率预测值表
年份
类型 | 2006 | 2007 |
城市 | 3.9349% | 4.1075% |
镇 | 4.2996% | 4.0203% |
乡 | 3.0676% | 2.6847% |
由此可见,我国人口在这两年内虽然会增加,但是人口净增长率将会逐渐减小并趋于稳定。且可以看出城镇化趋势越来越严重。鉴于这种情况,下面我们对人口分布的城镇化比例进行预测。
求解城市、镇、乡三种类型所占人口总数的比重
根据题给附件的EXCEL表中2005年中国人口1%调查数据,通过计算得到市、镇、乡三种类型占人口总数的比重,见下表4。
表4 三种类型所占比重
年份
类型 | 2001 | 2002 | 2003 | 2004 | 2005 |
城市 | 0.2420 | 0.2616 | 0.2602 | 0.2582 | 0.2772 |
镇 | 0.1297 | 0.1880 | 0.1522 | 0.1536 | 0.1712 |
乡 | 0.6283 | 0.6129 | 0.5876 | 0.5882 | 0.5516 |
表5 各类型人口所占总人口的比例预测值表
年份
类型 | 2006 | 2007 |
市 | 27.58% | 28.06% |
镇 | 18.80% | 20.59% |
乡 | 54.08% | 52.42% |
分析城镇化比例预测值表及以上数据,可知该增长点主要是由于生产力的快速发展,各镇无法满足当地人民的生活需要,城镇人口大量涌入城市,进一步造成城镇化比例越来越大。但是,从乡村人口所占比例来看,呈现负增长趋势,可见,我国的改革使得城镇化趋势有所缓解。这与近年来人们返璞归真,走进大自然的思想还是很吻合的。因此可见,我们的模型能够反映的发展动态,以及人民的思想变化,还是较好的。
计算总人口的净增长率趋势
根据总人口净增长率等于市、镇、乡各类型人口净增长率与对应所占比例增长率的乘积之和,计算出总人口的净增长率趋势。即2006年总人口净增长率=市人口净增长率城市人口比例+镇人口净增长率镇人口比例+乡人口净增长率乡人口比例。2007年的总人口净增长率的计算方法类似。从而计算得到2006总人口净增长率为3.5524%,2007年的总人口净增长率为3.3874%。
从以上数据及图表分析得知,中短期总人口净增长率逐渐减小并趋于稳定。出现这一现象的原因之一是我国实施计划生育,直接导致总人口净增长率下降;另外,我国社会主义经济持续增长,国民受教育程度越来越高,更多的人加入到晚婚晚育的行列,且封建残留的思想——生女孩不好,已经基本得到缓解,致使越来越多的人生育一胎化,使更替水平趋于稳定,进而使总人口净增长率下降并趋于稳定。
由此可见,要从根本上解决总人口不断增长的趋势,还得进一步实施提出的“科学是第一生产力”的理念,提高全体国民的素质,加强推行计划生育的,鼓励优生优育、晚婚晚育等。
人口结构预测
老龄化发展程度的预测
根据附件2所给数据,通过EXCEL分别计算得到2001—2005年市、镇、乡三种类型老年人口(65岁以上人口)所占的比率,即求得三种类型的老龄化人口比重。
表6 市、镇、乡及全国的老龄化人口比重
年份 | 市 | 镇 | 乡 | 全国 |
2001 | 7.69 | 6.16 | 6.67 | 6.85 |
2002 | 8.15 | 6.62 | 6.93 | 7.21 |
2003 | 8.83 | 6.6 | 7.19 | 7.53 |
2004 | 8.42 | 7.44 | 7.88 | 7.95 |
2005 | 7.99 | 7.39 | 8.73 | 8.3 |
2006 | 8.477 | 7.83 | 9.001 | 8.68 |
2007 | 8.555 | 8.15 | 9.508 | 9.06 |
其中,W是指乡的老龄化人口占总人口的比率,t表示时刻,表示时刻t的系数。
通过SAS程序(附件1.2)得到结果如下:
表7 模型的检验参数表
方差来源 | 自由度 | 平方和 | 标准差 | F值 | Pr〉F |
组内平方和 | 1 338 | 2.57049 | 2.57049 | 39.60 | 0.0081 |
误差平方和 | 3 | 0.19471 | 0.090 | ||
总平方和 | 4 | 2.76520 |
表8 各变量的检验参数表
变量 | 估计值 | 标准差 | T值 | Pr〉|t| |
intercept | 5.959 | 0.2672 | 22.30 | 0.0002 |
x1 | 0.507 | 0.08056 | 6.29 | 0.0081 |
通过上述预测模型计算得到2006年乡老龄化人口的预测值为9.001%,2007年老龄化人口的预测值为9.508%。
同理,运用多次逐步回归对城市和镇的老龄化人口占总人口的比率进行预测,得到如下结果:城市老龄化人口的模型为:y=0.087*+7.955,并通过预测模型计算得到2006年老龄化人口的预测值为8.477 %,2007年老龄化人口的预测值为8.555%;镇老龄化人口的模型为; y=0.328*+5.858,并通过预测模型计算得到2006年老龄化人口的预测值为7.83 %,2007年老龄化人口的预测值为8.15%。
表9 老龄化人口分布表
年份
类型 | 预测模型 | 2006年预测值 | 2007年预测值 |
城市 | y=0.087*+7.955 | 8.477 % | 8.555% |
镇 | y=0.328*+5.858 | 7.83 % | 8.15% |
乡 | 9.001% | 9.508% |
总老龄化人口占总人口的比率=市老龄化人口的比率城市人口比例+镇老龄化人口的比率镇人口比例+乡老龄化人口的比率乡人口比例。
计算得到2006年总老龄化人口比率为8.6775%,2007年总老龄化人口比率为9.0619%。
图1 市、镇、乡及全国的老龄化程度图
由以上计算及图表分析,城市老龄化程度有一定的波动性,这与乡镇大量人口涌入城镇以及环境污染的条件下,城市大量人口有返璞归真,接近自然的思想休戚相关。这一对矛盾的统一体使得城市老龄化人口有一定的波动性。乡镇老龄化程度有一定程度的增长,这与我国医疗保健水平的提高导致死亡率降低,以及出生率降低致使老龄化程度相对较高有紧密的关系。
5.1.3.2 男女出生性别比的预测:
通过对附件数据1994-2005年的市、镇、乡的男女出生比例来预测分析,首先以城市男女出生比例为例:采用多次逐步拟合进行预测,最终选择2次拟合。
求得关系式为:
拟合效果如下图:
图2 城市男女出生性别比拟合图
预测06年、07年的男女出生比例分别为:116.99 118.88
同理可得:镇的男女出生比例关系模型为:,并且进一步计算得到2006年、2007年的男女出生比例的预测值分别为: 126.88,129.08;乡的男女出生比例关系模型为:。
并且进一步计算得到2006年、2007年的男女出生比例的预测值分别为:121.14,121.09
结合上述计算的城镇化人口比例,运用公式:
总男女出生人口比率=城市男女出生人口的比率城市人口比例+镇男女出生人口的比率镇人口比例+乡男女出生人口的比率乡人口比例。
计算得到2006年总男女出生人口的比率为121.628,2007年总男女出生人口的比率为123.400(女性以100计)。
表 10 男女出生比例预测模型计预测值表
类型 | 男女出生性别比例关系模型 | 06年男女出生比例 | 07年男女出生比例 |
市 | 116.99 | 118.88 | |
镇 | 126.88 | 129.08 | |
乡 | 121.14 | 121.09 |
图3 市、镇、乡男女出生比例图
由图及计算的数据得知,在短期内,经济的发展不会突飞猛进,城镇化程度也不会达到非常高,人们重男轻女思想不会有转折性突变,因此性别比会呈现递增趋势
抚养比预测
扶养比也是衡量一个国家经济实力的重要指标,影响着国家经济状况的发展。因此,对于国民经济的预测也很有必要。
扶养比为非劳动人口与劳动人口的比值,且结合中国统计年鉴的分类标准,将15—岁人口定义为劳动人口,通过EXCEL计算求和得到2001—2005年的劳动人口以及非劳动人口比率。通过公式:扶养比=非劳动人口的比率/劳动人口的比率,计算得到下表。
表11 2001-2005年扶养比变化表
年份 | 市 | 镇 | 乡 |
2001年 | 0.3303 | 0.3907 | 0.4856 |
2002年 | 0.3247 | 0.3954 | 0.4627 |
2003年 | 0.3244 | 0.3798 | 0.4533 |
2004年 | 0.3119 | 0.365 | 0.428 |
2005年 | 0.3083 | 0.3799 | 0.4595 |
表12 2002-2005扶养比的GM(1,1)灰色系统预测值与实际值比较
年份 | 预测值 | 实际值 | 残差q | 相对误差ξ 1(%) |
2002 | 0.3266 | 0.3247 | 0.00191 | 0.588 |
2003 | 0.3203 | 0.3244 | -0.004067 | -1.254 |
2004 | 0.3141 | 0.3119 | 0.00228 | 0.731 |
2005 | 0.3081 | 0.3083 | -0.000158 | -0.051 |
总扶养比人口比率=城市扶养比人口的比率城市人口比例+镇扶养比人口的比率镇人口比例+乡扶养比人口的比率乡人口比例。
计算得到2006年总扶养比人口的比率为0.3909,2007年总扶养比人口的比率为0.3869。
表13 三种类型扶养比预测表
抚养比 | 06年抚养比比例 | 07年抚养比比例 |
市 | 0.3022 | 0.29 |
镇 | 0.37 | 0.3588 |
乡 | 0.44206 | 0.4386 |
图4 市、镇、乡及全国的扶养比变化图
由以上数据及表格得到扶养比有递减的趋势,主要原因是出生率有下降趋势,0—14岁人口逐渐减少且随着我国加入世界贸易组织,拥有越来越多的工作岗位等等原因。这就使得扶养比出现上述结果。
5.1.3.4 育龄妇女所占比重
运用附件2中所给15—49岁女性比率,通过EXCEL表求和得到育龄妇女所占比重。并且在更替水平保持稳定一致的前提下,认为15—49岁女性所占比率和即为育龄妇女所占的比率。
表14 育龄妇女比率表(单位:%)
市 | 镇 | 乡 | |
2001年 | 30.67 | 39.68 | 26.52 |
2002年 | 30.28 | 29.14 | 26.78 |
2003年 | 29.91 | 29.37 | 26.73 |
2004年 | 30.31 | 29.4 | 26.84 |
2005年 | 30.44 | 28.81 | 25.82 |
2006年 | 2007年 | |
城市 | 30.456 | 30.5454 |
镇 | 28.942 | 28.84757 |
乡 | 25.8619 | 25.5954 |
结合上述计算的城镇化人口比例,运用公式:
总育龄妇女人口比率=城市育龄妇女人口的比率城市人口比例+镇育龄妇女人口的比率镇人口比例+乡育龄妇女人口的比率乡人口比例。
计算得到2006年总育龄妇女人口的比率为27.8262%,2007年总育龄妇女人口的比率为27.9255%。
分析可知育龄妇女所占人口的比率基本不变。
生育率的预测
因为附件2中2000年的生育率数据缺失,鉴于1994-2005年数据呈线性递减,我们采用1999年和2001年的平均值作为2000年的生育率数据。以城市为例,对生育率利用多次逐步拟合的方法进行预测,拟合结果如下图:
图5 城市生育率拟合图
同理可得镇、乡生育率拟和曲线,结果如下表:
表16 生育率拟和曲线表
类型 | 生育率拟和曲线 |
城市 | y1=0.11767*t*t-472.71*t+474750 |
镇 | y2=-0.2901*t*t+1158.5*t-1156600 |
乡 | Y3=-0.03377*t*t+133.39*t-131650 |
图6 市、镇、乡生育率变化图
由上分析可知生育率逐渐减小,其中乡的育龄妇女的生育率〉镇的育龄妇女的生育率〉市的育龄妇女的生育率。
长期人口预测
模型一
1、鉴于我们研究的是在没有大的自然灾害、社会动荡因素及生物技术水平带来的医疗技术的巨大的突破情况下的人口发展模型,因此,可认为死亡率基本不变,但生育率会有较大变化。人口数量受出生率,育龄妇女所占总人口的百分比、生育率等的影响。男女出生性别比例,直接关系到将来育龄妇女所占总人口的百分比,从而影响出生率,进而影响人口数量。
2、通过1994-2005年数据可知:在短期内育龄妇女所占总人口的百分比波动不是很大,可以直接通过这些数据预测今后育龄妇女所占总人口的百分比来推算未来人口数量,或者直接通过以往人口数量来预测未来人口数量,所产生的误差不大。但由于男女出生性别比一直增加,在长期预测中,育龄妇女所占总人口的百分比变化很大,并且生育率变化也很大。因此在长期内,必须考虑男女出生性别比例和生育率的影响。
在如下模型中主要考虑男女出生性别比例和生育率是对人口数量的影响。
男女出生性别比例预测
城市男女出生性别比相对乡村要平衡一些,随着时间的推移,城镇人口所占的比例会逐渐增加,而导致总的男女出生性别比会变化,因此建立男女出生性别比随城镇化程度及时间的关系变化模型。
表17 各类型人口数量比例随时间变化的关系式表
类型 | 各类型人口数量比例随时间变化的函数关系式 |
城市 | w1=0.00669313650*t -13.1465 |
镇 | w2=0.0111216010*t -22.13013 |
乡 | w3=0.0178147375*t+ 36.276 |
城市,镇,乡村的男女出生性别比随时间变化的数学模型:
表18 各类型人口数量比例随时间变化的关系式表
类型 | 男女出生性别比随时间变化的的函数关系式 |
城市 | |
镇 | |
乡 |
M=w1*y1+w2*y2+w3*y3(M表示第t年的总的男女出生性别比)
对预测结果进行数据分析:发现结果与实际有一定出入,男女出生性别比会越来越大。因此利用阻滞增长模型的原理对上述模型进行改进,设立阀值,使模型更加符合实际;通过数值分析可得,市、镇、乡性别比例不应超过114 ,120 ,122。
对改进后模型进行分析:城市的男女出生性别比较乡村小,会以较快速度接近稳定值,而镇、乡的男女出生性别比较大,性别比波动期较长。
对预测结果进行数据分析:男女出生性别比会先增长,后减小(受城镇化程度影响),最终会趋于在113.5的附近波动。
老龄化程度的预测
城市的老龄化程度较乡村高,随着时间的推移,城镇人口所占的比例会逐渐增加,而导致总的老龄化程度变化。
表19 各类型人口老龄化程度随时间变化的关系式表
类型 | 各类型人口老龄化程度随时间变化的函数关系 |
城市 | v1=0.087*+7.955 |
镇 | v2=0.328*+5.858 |
乡 |
M=v1*y1+v2*y2+v3*y3(M表示第t年的总的男女出生性别)
同样利用阻滞增长模型原理对上述模型进行改进。
对改进后模型预测结果进行数据分析:老龄化程度不断加大,最终将会趋于在一定的范围内波动。
生育率的预测
城市的育龄妇女的生育率比乡村要小很多,随着时间的推移,城镇人口所占的比例会逐渐增加,而导致总的生育率会变化很大。
表20 各类型育龄妇女的生育率随时间变化的关系式表
类型 | 各类型育龄妇女生育率随时间变化的函数关系 |
城市 | u1=0.11767*t*t-472.71*t+474750 |
镇 | u2=-0.2901*t*t+1158.5*t-1156600 |
乡 | u3=-0.03377*t*t+133.39*t-131650 |
人口数量预测
因为死亡率基本不变,则育龄妇女所占总女性人口的百分比不变;而女性人口占总人口的比率由于男女出生性别比例变化而变化。
取2005年为基年;育龄女性占总女性人口的百分比为65.35%,设性别比例为M,生育率为K,死亡率为6.19%,人口总量为13.0756亿。
根据人口净增长率=生育率*育龄妇女所占总人口的百分比-死亡率=0.6535*K*100/(M+100)-6.19%。利用男女出生性别比的模型方程、老龄化程度预测的模型方程代入求解(见附件5、6)。最终得出如下结论:在2042年出现人口峰值,此时人口增长率为0.016%(2043年人口增长率为负数),人口数量达到最大为16.2295亿。此时男女出生性别比达到平衡,大约在113.5附近波动。生育率大约在19‰附近波动。此时的城镇化程度分别为:城市人口所占比重为28.40%,镇所占比重为31.61%,乡所占比重为39.99%
图7 2005—2055年未来人口预测图
模型二
leslie模型及其分析
本模型是基于leslie模型的改进模型,下面对leslie模型的一个较为详细的介绍。leslie模型是一个考虑年龄结构的离散人口模型,模型表示如下:
写成矩阵形式即为:X(=RX().
R=
以为初始年限,依次递推可得一个用于预测人口总量及其年龄结构的模型:
X(=RnX(),
其中xi(表示第(年年龄段i的人口总数,
ai表示年龄段为i的女性平均生育女性率,
bi表示年龄段为i的女性由时刻(进入到(时刻的存活率,
5.2.2.2 leslie模型的改进模型
leslie模型只考虑了女性人口数,且将各年龄段女性的生育率、生存率均设为常数,这样做虽然大大简化了模型,易于预测人口总量及其年龄结构。实际上,尽管各年龄段女性的生存率可能大致不变,可以看作常数,但是生育率却会出现较大的波动,这与生活水平、生育观念有紧密的联系。随着的改变,医疗诊断水平得以不断提高,男女出生比例不再是自然生育状况下的比例,而有较大的波动。
leslie模型不考虑男性人口情况,完全依赖于女性数据并根据某一确定的男女性别比计算人口总量,这种做法有待改进。针对lieslie模型中的不合理成分,我们考虑模型的改进方向:第一,考虑男性的人口比率;第二,针对生育率确定这一条件,寻求一个随时间变化的生育率,使模型更加完善。
由附件中给出的数据可分别求出各年龄段男性、女性的加权平均死亡率,鉴于我们研究的是在没有大的自然灾害、没有社会动荡因素及生物技术水平带来的医疗技术的巨大突破情况下的人口发展模型,因此,可认为各年龄段男性、女性的死亡率基本不变。再由1994年—2005年的男女性别比并结合实际情况,可以看出男女性别比将在一个范围内波动。为简化模型,我们将男女性别比取其平均值,这样,根据性别比即可分别求出男性、女性的leslie矩阵,
结合中国统计年鉴的分类标准,育龄妇女为14—49岁的女性,考虑将育龄女性和非育龄女性划为不同组别,我们以5年为一个年龄段,将0—岁人群化为18个年龄段,并将大于90岁的人划为一个年龄段进行处理,共划分为19个年龄段。
根据题目附件所给数据,我们可计算出2001—2005这五年内育龄女性在各年龄段的生育率(其中2003年的妇女生育率显然有问题,可将它作一个放大十倍的处理则比较合理),并由此预测生育率的趋势。但由于数据有限,预测的年限越多,由此造成的累积误差就越大,因此我们只预测三年的生育率。
针对以上两个方向,现作出一改进模型,如下:
易知,各年龄段人口数=男性各年龄段人数+女性各年龄段人数;考虑男女性别比,则生育率不为常数。先根据数据预测得出一个总体趋势,用变化的生育率作较短期预测。而在作长期预测时则采用变化并取定值的混合方略。具体模型如下:
其中,
Ai = Bi=
(i=1,2,3)
模型的求解及其分析
编写MATLAB程序(见附件7)求解上述模型,对城、镇、乡的数据均作预测。
首先预测出2010—2050年人口总数:
表21 2010—2050年人口总量预测值表
年份 | 城市 | 镇 | 乡 | 总人口 |
2010 | 3. | 2.2831 | 7.5144 | 13.69 |
2015 | 4.1507 | 2.3794 | 7.8299 | 14.3600 |
2020 | 4.3481 | 2.4462 | 8.1792 | 14.9735 |
2025 | 4.4752 | 2.5120 | 8.4618 | 15.4490 |
2030 | 4.5374 | 2.5511 | 8.6108 | 15.6993 |
2035 | 4.6163 | 2.5583 | 8.6531 | 15.8277 |
2040 | 4.7140 | 2.5377 | 8.6173 | 15.8690 |
2045 | 4.7650 | 2.43 | 8.5258 | 15.7801 |
2050 | 4.7318 | 2.4031 | 8.3785 | 15.5134 |
2055 | 4.6550 | 2.3184 | 8.2605 | 15.2339 |
图8 人口总量预测值图
图9 2010年与2035年各类型人口预测对比图
分析以上图表:由2010—2050年人口总量预测值表及预测图可知人口数量先增大后减小,峰值出现在2040年,此时,人口数量达到最大为15.869亿。近些年来,计划生育工作的有效实施,使我国人口迅猛增长的局势得到控制,人口净增长率呈下降趋势,在现有波动不大的情况下,我国人口应会出现一个先增大后减小,出现峰值的情况,这与本模型的结果相吻合,说明此模型在预测人口总量时比较合理。
但对照2010年与2035年预测的城、镇、乡人口比例图得知:市人口预测值由28%增长到29%,增长了1个百分点;镇人口下降了一个百分点,乡人口预测值基本没有很大变化。这与我国城镇化比率不断提高现实情况极不吻合,主要是因为此模型没有考虑乡镇居民向城市居民转化的因素,因此,此模型在预测城镇化程度时,极不合理。
其次,预测出2015、2020、2025、2045这四年的各年龄段人口数,详细结果见附录,分析可知 2015年35-50这一年龄段得人口分布最多,这一结果与我国实际情况也十分吻合:在上世纪70-80年代生育率大增,造成这一时期出生人口较多,而后由于计划生育的实施,每年的人口出生量得到控制,有所下降。这一结果进一步表明所建模型的合理性。而到2045年时,50-70岁这一年龄段的分布的人口最多,我国老年化程度达到最大。
预测出的2015年的城、镇、乡的人数如下:
表22 2015年各年龄段人口数(单位:亿)
年龄段 | 市 | 镇 | 乡 |
0-4 | 0.2817 | 0.1326 | 0.4037 |
5-9 | 0.2953 | 0.2185 | 0.3668 |
10-14 | 0.1523 | 0.1173 | 0.4258 |
15-19 | 0.17 | 0.1401 | 0.4986 |
20-24 | 0.2094 | 0.1775 | 0.6547 |
25-29 | 0.2876 | 0.1904 | 0.6297 |
30-34 | 0.281 | 0.1271 | 0.3877 |
35-39 | 0.2922 | 0.1573 | 0.4019 |
40-44 | 0.3586 | 0.2114 | 0.541 |
45-49 | 0.3674 | 0.2349 | 0.68 |
50-54 | 0.3394 | 0.2042 | 0.587 |
55-59 | 0.2659 | 0.1468 | 0.4632 |
60- | 0.2565 | 0.1524 | 0.5332 |
65-69 | 0.1801 | 0.1087 | 0.3969 |
70-74 | 0.1284 | 0.0786 | 0.2903 |
75-79 | 0.1142 | 0.0639 | 0.2336 |
80-84 | 0.0884 | 0.049 | 0.1835 |
85- | 0.0514 | 0.0295 | 0.1117 |
90+ | 0.0244 | 0.0149 | 0.0559 |
合计 | 4.1507 | 2.555 | 7.8299 |
模型的改进
能通过多种方法求解每个问题的答案,但个别项目的数据还需加强。
,建议
要从根本上解决总人口不断增长趋势,还得进一步实施提出的“科学是第一生产力”的理念,提高全体国民的素质,加强推行计划生育的,鼓励优生优育、晚婚晚育等。
参考文献
[1] 谭永基等,数学模型,[M],上海:复旦大学出版社。
[2] 姜启源等,大学数学实验,[M],北京:清华大学出版社。
[3] 于秀林,任学松.多元统计分析,[M],北京:中国统计出版社。
[4] 盛聚等,概率论与数理统计[M],北京:高等教育出版社。
[5] 朱军,线形模型分析原理,[M],1999。
[6] 薛定宇,陈阳泉,高等应用数学问题的MATLAB求解,[M],北京:清华大学出版社,2004。
附录
附件1:
市七个年龄段的净总人口变化百分比
2005 | 2004 | 2003 | 2002 | 2001 | |
1--14 | 0.8546 | 0.37 | 0.7545 | 0.7797 | 0.8025 |
15--19 | 0.6295 | 0.6546 | 0.6997 | 0.7345 | 0.7498 |
20--29 | 1.0028 | 1.0258 | 0.9539 | 0. | 0.85 |
30--49 | 0.8588 | 0.7797 | 0.7969 | 0.8404 | 0.8815 |
50--65 | 1.7822 | 1.732 | 1.8231 | 2.002 | 2.0469 |
66--90+ | 3.2125 | 3.1886 | 2.9026 | 2.83 | 2.9497 |
2005 | 2004 | 2003 | 2002 | 2001 | |
1--14 | 0.7835 | 0.8292 | 0.7414 | 0.7055 | 0.7631 |
15--19 | 0.7719 | 0.7546 | 0.8582 | 0.8781 | 0.9371 |
20--29 | 1.3332 | 1.2512 | 1.0993 | 1.0934 | 0.9626 |
30--49 | 0.7122 | 0.7298 | 0.7973 | 0.8395 | 0.3 |
50--65 | 1.7709 | 1.8837 | 2.0315 | 2.0715 | 2.1653 |
66--90+ | 3.3848 | 3.2376 | 3.36 | 3.2067 | 3.3177 |
2005 | 2004 | 2003 | 2002 | 2001 | |
1--14 | 0.79 | 0.769 | 0.7504 | 0.7422 | 0.7052 |
15--19 | 0.84 | 0.7781 | 0.8665 | 0.9308 | 1.0451 |
20--29 | 1.5924 | 1.4479 | 1.2975 | 1.1912 | 1.0828 |
30--49 | 0.6971 | 0.7943 | 0.8812 | 0.9276 | 0.974 |
50--65 | 1.33 | 1.6213 | 1.7455 | 1.8026 | 1.86 |
66--90+ | 3.207 | 3.1332 | 3.1298 | 3.1201 | 3.0946 |
%程序中的变量定义:alpha是包含α、μ值的矩阵;ago是预测后累加值矩阵;var是预测值矩阵;error是残差矩阵; c是后验差比值
function gm(x); %定义函数gm(x)
clc; %清屏,以使计算结果显示
format long; %设置计算精度
if length(x(:,1))==1 %对输入矩阵进行判断,如不是一维列矩阵,进行转置变换
x=x';
end;
n=length(x); %取输入数据的样本量
z=0;
for i=1:n %计算累加值,并将值赋与矩阵be
z=z+x(i,:);
be(i,:)=z;
end
for i=2:n %对原始数列平行移位
y(i-1,:)=x(i,:);
end
for i=1:n-1 %计算数据矩阵B的第一列数据
c(i,:)=-0.5*(be(i,:)+be(i+1,:));
end
for j=1:n-1 %计算数据矩阵B的第二列数据
e(j,:)=1;
end
for i=1:n-1 %构造数据矩阵B
B(i,1)=c(i,:);
B(i,2)=e(i,:);
end
alpha=inv(B.'*B)*B.'*y; %计算参数α、μ矩阵
for i=1:n+1 %计算数据估计值的累加数列,如改n+1为n+m可预测后m-1个值
ago(i,:)=(x(1,:)-alpha(2,:)/alpha(1,:))*exp(-alpha(1,:)*(i-1))+alpha(2,:)/alpha(1,:);
end
var(1,:)=ago(1,:)
for i=1:n %如改n为n+m-1,可预测后m-1个值
var(i+1,:)=ago(i+1,:)-ago(i,:); %估计值的累加数列的还原,并计算出下一预测值
end
for i=1:n
error(i,:)=var(i,:)-x(i,:); %计算残差
end
c=std(error)/std(x); %调用统计工具箱的标准差函数计算后验差的比值c
ago %显示输出预测值的累加数列
alpha %显示输出参数α、μ数列
var %显示输出预测值
error %显示输出误差
c %显示后验差的比值c
主程序:x=[3.4502,2.9174,4.2779,3.5108];gm(x)
附件3 拟合程序:
x=1994:1:2005;
y=[124.33 115.62 111.68 125.9 108.73 118.4 116.3 116.02 123.12 110.97 126.9 117.21]';
A=polyfit(x,y,2)
z=polyval(A,x);
plot(x,y,'k+',x,z,'r') %作出数据点和拟合曲线的图形
附件 4 多元逐步回归程序:
data ex;input y t@@;
x1=t;x2=t*t;x3=t*t*t;x4=t*t*t*t;
cards;
/输入数据/
;
proc reg;model y=x1 x2/selection=stepwise noint stb;
run;
附件 5 长期预测模型一改进前的程序:
for i=1:50
M(i)=(-0.0001335*(i+2000)*(i+2000)+ 0.5415*(i+2000)-548.76)*(0.12752*(i+2000)*(i+2000)-509.85*(i+2000)+509725)+(0.0013235*(i+2000)*(i+2000)-5.2907*(i+2000)+5287.6)*(0.15104*(i+2000)*(i+2000)-603.92*(i+2000)+603800)+(-0.00119*(i+2000)*(i+2000)+4.7492*(i+2000)-4737.8)*(-0.034965*(i+2000)*(i+2000)+140.26*(i+2000)-140540);
K(i)=(-0.0001335*(i+2000)*(i+2000)+ 0.5415*(i+2000)-548.76)*(-0.2901*(i+2000)*(i+2000)+1158.5*(i+2000)-1156600)+(0.0013235*(i+2000)*(i+2000)-5.2907*(i+2000)+5287.6)*(0.15104*(i+2000)*(i+2000)-603.92*(i+2000)+603800)+(-0.00119*(i+2000)*(i+2000)+4.7492*(i+2000)-4737.8)*(-0.03377*(i+2000)*(i+2000)+133.39*(i+2000)-131650);
end
for i=1:50
D(i)=K(i)*100/(M(i)+100)-6.19;
end
D
附件 6 长期预测模型一改进后的程序:
for i=1:50
M(i)=(0.00669313650000*(i+2005)-13.14651260370237)*114+(0.01112160100000*(i+2005)-22.13013296260779)*117+(-0.01781473750001*(i+2005)+36.276556631026)*122;
K(i)=(0.00669313650000*(i+2005)-13.14651260370237)*19+(0.01112160100000*(i+2005)-22.13013296260779)*23+(-0.01781473750001*(i+2005)+36.276556631026)*28;
end
for i=1:50
D(i)=(0.6535*K(i)*100)/(M(i)+100)-6.19;
end
D
E=zeros(1,50)
E(1)=13.0756
for i=1:50
E(i+1)=E(i)*(1+D(i)/100);
end
E
附件7 预测人口总数及结构分布的MATLAB程序
function[p]=gg1(n)
Y=zeros(1,19);
k1=0.5413;
k2=0.4587;
A1=zeros(19,19);
A2=zeros(19,19);
A3=zeros(19,19);
B1=zeros(19,19);
B2=zeros(19,19);
B3=zeros(19,19);
b1=[1.7220 0.3572 0.2379 0.4597 0.5513 0.6211 0.52 1.2503 2.0223 3.4906 4.5055 6.5578 11.1216 18.9901 30.0417 48.8077 81.1667 137.1858];
b2=[1.5631 0.1651 0.1983 0.1974 0.1998 0.2550 0.3450 0.6135 0.8502 1.4736 2.5092 3.9507 6.8072 11.5530 19.2839 35.0371 59.9107 102.5761];
a1=0.01*[0 0 0 3.21972 82.15858333 72.72637821 28.49137624 7.254 1.625 0.348 0 0 0 0 0 0 0 0 0];
a2=0.01*[0 0 0 3.756 78.80517448 76.59446943 28.371218 7.482 1.7203 0.421 0 0 0 0 0 0 0 0 0];
a3=0.01**[0 0 0 4.29 75.58863935 80.66829247 28.2524113 7.71 1.863 0.543 0 0 0 0 0 0 0 0 0];
A1(1,:)=k1*a1;B1(1,:)=k2*a1;
A2(1,:)=k1*a2;B2(1,:)=k2*a2;
A3(1,:)=k1*a3;B3(1,:)=k2*a3;
n=10;
for i=1:18
A1(i+1,i)=1-0.001*b1(i);
A2(i+1,i)=1-0.001*b1(i);
A3(i+1,i)=1-0.001*b1(i);
B1(i+1,i)=1-0.001*b2(i);
B2(i+1,i)=1-0.001*b2(i);
B3(i+1,i)=1-0.001*b2(i);
end
X1=13.0756*0.01*0.2772*[2.27 2.61 3.06 3.99 3.73 3.91 4.93 5.1 4.79 3.73 3.55 2.49 1.78 1.6 1.29 0.77 0.36 0.12 0.03]';
X2=13.0756*0.01*0.2772*[1.94 2.26 2.72 3.95 4.03 4.16 4.98 5.06 4.61 3.65 3.59 2.55 1.85 1.68 1.32 0.82 0.46 0.18 0.07]';
if n==1
Y=A1*X1+B1*X2;
end
if n==2
Y=A1*A2*X1+B1*B2*X2;
end
if n>=3
Y=A1*A2*A3^(n-2)*X1+B1*B2*B3^(n-2)*X2;
end
p=sum(Y);
附件 8
2020年各年龄段人口数(单位:亿)
年龄段 | 市 | 镇 | 乡 |
0-4 | 0.2479 | 0.1179 | 0.4915 |
5-9 | 0.2829 | 0.214 | 0.4036 |
10-14 | 0.2981 | 0.2242 | 0.3697 |
15-19 | 0.1523 | 0.1172 | 0.4256 |
20-24 | 0.17 | 0.1401 | 0.4982 |
25-29 | 0.2093 | 0.1773 | 0.6538 |
30-34 | 0.2875 | 0.16 | 0.6287 |
35-39 | 0.2809 | 0.1269 | 0.387 |
40-44 | 0.2919 | 0.1571 | 0.401 |
45-49 | 0.3581 | 0.2111 | 0.5396 |
50-54 | 0.3665 | 0.2342 | 0.6623 |
55-59 | 0.3382 | 0.2033 | 0.584 |
60- | 0.25 | 0.1458 | 0.4595 |
65-69 | 0.2542 | 0.1508 | 0.5263 |
70-74 | 0.1774 | 0.1068 | 0.3882 |
75-79 | 0.1253 | 0.0763 | 0.2795 |
80-84 | 0.1094 | 0.0606 | 0.2195 |
85- | 0.0822 | 0.0449 | 0.1658 |
90+ | 0.0452 | 0.026 | 0.0954 |
合计 | 4.3481 | 2.7243 | 8.1792 |
年龄段 | 市 | 镇 | 乡 |
0-4 | 0.2059 | 0.1102 | 0.4868 |
5-9 | 0.2505 | 0.2401 | 0.4909 |
10-14 | 0.2852 | 0.2173 | 0.405 |
15-19 | 0.298 | 0.2241 | 0.3695 |
20-24 | 0.1522 | 0.1172 | 0.4252 |
25-29 | 0.1763 | 0.14 | 0.4975 |
30-34 | 0.2092 | 0.1767 | 0.6529 |
35-39 | 0.2873 | 0.15 | 0.6276 |
40-44 | 0.2806 | 0.1268 | 0.3862 |
45-49 | 0.2915 | 0.1569 | 0.4 |
50-54 | 0.3572 | 0.2105 | 0.5375 |
55-59 | 0.3652 | 0.2332 | 0.65 |
60- | 0.33 | 0.202 | 0.5794 |
65-69 | 0.2621 | 0.1442 | 0.4536 |
70-74 | 0.2504 | 0.1481 | 0.5148 |
75-79 | 0.173 | 0.1037 | 0.3737 |
80-84 | 0.12 | 0.0724 | 0.2626 |
85- | 0.1018 | 0.0557 | 0.1982 |
90+ | 0.0724 | 0.0395 | 0.1415 |
合计 | 4.4752 | 2.9079 | 8.4618 |
市 | 镇 | 乡 | ||||
0-4 | 0.2626 | 0.1661 | 0.3623 | |||
5-9 | 0.2626 | 0.2798 | 0.3363 | |||
10-14 | 0.2172 | 0.2208 | 0.3615 | |||
15-19 | 0.1796 | 0.2009 | 0.4191 | |||
20-24 | 0.2097 | 0.2302 | 0.4876 | |||
25-29 | 0.2538 | 0.2441 | 0.4908 | |||
30-34 | 0.2848 | 0.2161 | 0.4033 | |||
35-39 | 0.2975 | 0.2228 | 0.3675 | |||
40-44 | 0.1518 | 0.11 | 0.4222 | |||
45-49 | 0.1757 | 0.1388 | 0.4934 | |||
50-54 | 0.208 | 0.1754 | 0.6 | |||
55-59 | 0.2849 | 0.1875 | 0.61 | |||
60- | 0.2771 | 0.1248 | 0.3788 | |||
65-69 | 0.2857 | 0.1531 | 0.3883 | |||
70-74 | 0.3456 | 0.2023 | 0.5125 | |||
75-79 | 0.3458 | 0.2186 | 0.6082 | |||
80-84 | 0.3067 | 0.181 | 0.5068 | |||
85- | 0.2242 | 0.1199 | 0.363 | |||
90+ | 0.1916 | 0.1102 | 0.3592 | |||
合计 | 4.765 | 3.5088 | 8.5258 |