
摘要
灰色预测是比较重要的预测方法,在生活当中有许多领域都可以用灰色预测来进行预测,如在煤炭安全,大气污染,医学诊断等多方面,其在理论基础分析方面有许多优越性。本文主要应用灰色预测的模型来对中国人口数量的相关数据进行处理,解决“小样本、贫信息、不确定”等问题。从而预测中国近两年的人口数量。最后利用Matlab程序设计,对数据进行运行,从而得出所要预测的结果。研究结果表明:灰色模型预测算法应用于人口数量预测是可行的。
关键词
灰色预测;模型; 中国人口数量
Abstract:
Grey forecasting is the important prediction method, can be used in the field of life has a lot of grey prediction to predict, such as the coal safety, air pollution, medical diagnosis, etc, it has many advantages in terms of theory analysis. In this paper, the grey prediction model to the relevant data of China's population, to solve the small sample, poor information, and uncertain "and so on. To predict the population of China almost 2 years. Use of Matlab programming, and then the data is running, and to predict the results. The results show that grey model prediction algorithm is applied to population prediction is feasible.
Key words:
Grey prediction; GM(1,1)model; China's population;
目录
1前言 1
1.1研究背景 1
1.2国内外文献综述 2
2灰色系统的相关理论 3
2.1灰色系统理论的产生及发展 3
2.2灰色系统理论的概念 4
2.3灰数及其运算规则 5
2.4区间灰数的运算 6
3灰色预测 7
3.1灰色系列算子 7
3.2 GM(1,1)模型的原理 10
3.3 GM(1,1)模型的三大检验方法 13
4GM(1,1)模型预测 14
4.1人口数量分析 14
4.2人口数量预测及其检验 16
4.2.1人口数量模型的建立 16
4.2.2模型的检验 21
5结论 23
致谢 24
参考文献 25
附录A译文 26
附录B外文 34
1.前言
1.1研究背景
中国是世界上人口最多的国家。中国的资源占有量在世界中名列前茅,但是中国人口平均占有的的资源却在世界中排名很低,人口数量过多是很严重的,这个问题对我国的各个方面都有着很大的影响。人口众多是我国基本国情。从新中国成立至今,我国的人口不断的发展,我国人口的情况也在不断的变化。我国经历了两大人口发展阶段,一是30年的高速增长阶段。从上个世纪50年代初开始,一直到上个世纪的70年代初,中国的人口状况由出生率很高但是死亡率也很高的阶段,逐渐进入了出生率高死亡率低的人口高速增长的阶段。二是20年的低速增长阶段。从上个世纪的90年代以来,我国的经济开始了迅速的发展,人民的文化水平随之逐渐提高,健康水平也随之逐渐提高。我国开始实行计划生育,实行“少生优生”。随着计划生育工作的逐步深入, 人口的出生率呈现出了大幅度下降的趋势。进入上个世纪90年代末期后, 我国的人口情况发生了巨大的转变,人口快速增长得到了控制。由于中国人口的数量很多,人口增长的问题依然十分严峻,从上个世纪90年代初到上个世纪90年代末之间,我国人口每年的平均人口增长的数量大大减少了,但每年的增长数量却依然有一千多万人,这仍然对我国的经济发展产生了很大的制约,很大的压力。在我国经济发展进程中,一定要控制人口数量的增长。因此,准确预测我国未来人口的数量和它的增长状况,为中国的经济和社会发展提供了有力的科学依据。
1.2国内外文献综述
1982年邓聚龙发表了第一篇中文论文《灰色控制系统》,这篇中文论文《灰色控制系统》的发表标志着灰色系统这一学科的诞生[4]。随后,灰色系统这一学科逐渐发展。从1985年开始,灰色系统的相关研究发展迅速[5]。19年,英文版的国际刊物《灰色系统》杂志正式创刊[6]。灰色关联分析主要是用依据分析对象,对某一基准的关联度值按照聚类分析原则,使它也可用于聚类问题估记[7]。徐恒振[8]利用这种方法来鉴别溢油的模式,效果非常理想。利用灰色关联分析法可以构造油气标志组合模型,反映和查明汽油圈闭的行成和分布规律。徐忠详进行了大量的实际研究,提出了加权滑动灰色关联法[9],灰色综合定位预测法[10]、倾斜台阶灰关联定量反演方法等[11];Pan Henping将灰色关联法应用于矿床的形成与分类[12],该方法还可以通过关联度给出评价结果的可靠性[13]。许多灰色系统的科研成果得到奖励。据不完全统计获国家、省部级奖达142项。并先后召开了十次全国性灰色系统学术研讨会,与会人数达数千人(包括、澳门、……),在历次会议上共发表了数以千计的学术论文。
灰色系统着重解决“小样本、贫信息、不确定”问题。灰色系统是既含有已知信息又含有未知信息的系统。通过分析各种因素之间的关联性和量的测度,使系统的发展由不知到知,使系统的灰度逐渐减小,直至认识系统的变化规律。本文正是利用灰色系统的这些特点,对人口数量做一定的预测,对以后国家的人口数量有比较重要意义。
2 灰色系统的相关理论
2.1灰色系统理论的产生及发展
灰色系统理论是在一般系统理论的基础上产生的,近二十多年来,灰色系统理论作为系统科学的重要组成部分,已经有了很大的发展,奠定了坚实的发展基础。总体而言,灰色系统理论的发展趋势有:
(1) 从中国走向世界;自灰色系统理论的提出至今的二十多年里,灰色系统理论逐步得到国际学术界的承认,越来越多的国际学术团体和个人参与到灰色系统理论的研究中来。
(2) 从软科学走向硬科学;从灰色系统概念的提出到数学模型实现经历了很长的时间,随着灰数内涵认识逐步一致,灰色系统理论也将逐步从灰色思想的哲学层面演变成逻辑学科,实现从软科学到硬科学的转变。
(3) 理论体系日益严密和完善。经过长期发展,灰色系统理论形成了灰数学、灰预测、灰分析、灰评估、灰决策、灰控制等众多分支的学科。
具体而言,灰色系统理论的发展呈现出以下几个明显的战略性趋势:
(1) 灰色系统理论的学科体系建设和内容扩充呈加速趋势,其理论体系日益完善和学科内容的更加丰富;
(2) 灰色系统基础理论建设得到了强化,灰系统的哲学思想基础和数学分析、运算基础不断巩固,建立了较为完整的方体系和技术模型体系;
(3) 灰色系统理论的渗透力增强,运用灰色系统的思想和理论方法,融入其它系统科学和行为经济学的最新研究成果,开发出了一系列对现实具有更强的解释力、分析能力、预测能力和决策能力的新的模型;
(4) 发掘现实世界生物演化和人的决策的潜在规则,对灰系统理论的本身进行反思、批判与扬弃,对原有的模型进行改进与扩充,丰富和发展了灰色系统理论;
(5) 灰色系统理论以其独特的原理和方法为其他学科的建设与发展提供了丰富的思想营养,对有些学科甚至产生了性的影响,与其它学科发展的联系日益密切;
(6) 灰色系统理论在政治、经济、社会、文化和艺术等领域的应用日趋活跃,成为较为活的理论应用分支,甚至在有些领域形成了一道靓丽的风景。
2.2 灰色系统理论的概念
“灰”是介于“白”与“黑”之间的概念。白:指信息确定、数据完整。对应的是白色系统。黑 :指信息很不确定、数据很少。对应的是黑色系统。灰:指部分不完全、部分完全;信息部分不确定、部分确定;部分未知、部分已知。对应的即是灰色系统。灰性的本质是“少”与“不确定”。
我们可以通过系统的转换机构(系统状态)与环境对系统的输入以及系统对于环境的输出的相互关系,对系统可以进行内描述和外描述。通过输入与输出来描述系统变量的方法叫做系统的外描述。
灰色系统的研究路线为:灰色系统理论采取了从整体到部分再由部分到整体,从不同方位、不同角度来研究问题。因此,用序列作微分建模时,首先从序列的一个真正的微分方程模型应该满足那些条件的序列,建立近似的微分方程模型。
2.3灰数及其运算规则
灰数是灰色系统的基本“单元”。灰数是灰色系统理论的基础,通常把这种只知道取值范围而不知其确切值的数称为灰数,用记号“”表示灰数。
灰数有以下几类:
1.仅有下界的灰数
有下界而无上界的灰数记为,其中,为灰数的下确界,它是一个确定的数。称为的覆盖或灰域。若用表示天体的质量,便有。
2.仅有上界的灰数
有上界而无下界的灰数记为,其中, 是灰数的上确界,它是确定的数。
3.区间灰数
既有下界又有上界的灰数称为区间灰数,记为。
2.4 区间灰数的运算
定义: 设有灰数,用符号*表示与间的运算,若,则亦应为区间灰数,因此应有且对任意的,,有。
。
法则一:加法运算
设,则称
(2-1)
为与的和。
法则二:灰数的负元
设,则称
(2-2)
为的负元。
法则三:减法运算
设,则称
(2-3)
为与的差。
法则四:乘法运算
设,,则称
(2-4)
为与的积。
法则五:灰数的倒数 设,, ,则称
(2-5)
为的倒数。
3灰色预测
3.1灰色系列算子
(1) 缓冲算子公理
设系统行为数据序列为,若
1任意,总有,则称为单调增长序列;
21中不等号反过来成立,则称为单调衰减序列;
3存在有
则称为随机振荡序列。
设
称为序列的振幅。
(3) 均值生成
设序列 ,和为的一对紧邻值,则称为前值,称为后值,若有为老信息,为新信息;
若,则称 为由新信息与老信息在生成系数下的生成值。当时,称为的生成是“重新信息、轻老信息”的生成;又当5时,称为生成是“重老信息、轻新信息”生成;当,称的生成为非偏生成。
(4) 累加生成
累加生成(AGO)是对原始数据列中各时刻的数据依次累加,从而生成新的序列的一种手段[7]。
设为原始序列,并记。我们称为序列算子,
其中
则称为的一次累加生成算子,记为:1-AGO(Accumu Lating Generation Operator),称阶算子为次累加生成算子,记为,习惯上,我
们记
(5) 累减生成
累减生成(LAGO)是累加生成(AGO)的还原(逆运算),常简记为IAGO(Inverse Accumulated Generation Operator)。
设为原始序列,为序列算子,
其中
则称为的一次累减生成算子,阶算子称为的次累减生成算子。
3.2 模型的原理
灰色理论的微分方程型模型称为模型,表示Grey(灰),表示Model(模型)。表示1阶的,1个变量的微分方程。其简历过程如下∶
设有原始数据序列(非负序列),记,
灰色系统模型是在生成数列基础上,将时间序列转化为微方程的时间连续模型。首先对各原始序列进行一次累加,得到生成数列
其中
为的紧邻均值生成序列。
则有
其中
称为模型的基本形式。
若为待辩参数序列且参数算式为
则模型的最小二乘法估计参数列满足
这里的求法是根据最小二乘法中的定义而来,在此作简单的介绍,当,此式就是最小二乘法的问题。
如令
,
,
则,从而上述的问题可以表示为
因为,所以为二次函数,且
要使取得极值,只要使即可,从而有,
则。
(1)模型的白化方程也叫影子方程即:。这是一个一阶线性方程,它的解称为时间响应函数
此式中,,为待辩识参数,
根据上面算式求出,代入方程即得灰色模型。
(2)模型的时间响应序列
(3) 还原值为
-,
称模型中的参数为发展系数,为灰色作用量。反映了与的发展态势。模型的选择与发展灰数紧密相关,只有当的时候,运用模型才有意义。具体参见表3-1:
表3-1模型的适用条件
Table 3-1 for conditions
| 范围 | 备注 |
| 适合中长期预测 | |
| 适合短期预测 | |
| 慎用短期预测 | |
| 适合残差修正模型 | |
| 不宜使用模型 |
(1) 残差检验
记为原始数列与预测数列的绝对误差数列,其中,相对误差,拟合精度,若能控制在8%以内,则可认为模型通过残差检验。
(2) 关联度检验[11]
与的关联系数为,
则关联度为:;为分辨率,一般取0.5。根据经验,通常当时,关联度大于0.6便可认为模型通过关联度检验。
(3) 后验差检验
记为原始数列标准差,为绝对误差数列标准差,方差比,小误差概率为
令
,,则P=p{}
判断标准如下表3-2所示:
表3-2 后验差判断标准
Table 3-2 posterior variance criterion
| 效果 | ||
| 好 | ||
| 合格 | ||
| 勉强合格 | ||
| 不合格 |
4 .GM(1,1)模型预测
4.1人口数量分析
中国是经济大国,GDP在世界前列,而人均GDP却排在世界90多名。研究目的主要是应用灰色预测模型来对中国人口数量的相关数据进行处理,对中国人口数量进行预测。准确预测我国未来人口数量和人口数量的增长情况,对我国未来的经济发展和赎回发展有很大的帮助,为我国经济发展和社会发展提供了科学依据。
从中国统计年鉴查得2004年至2013年中国人口总数量如下:
图4-1中国近10年的人口数量
Figure 4-1 nearly 10 years of Chinese population (ten thousand people)
4.2 人口数量预测及检验
4.2.1 人口数量模型的建立
本文将应用模型来建立人口量预测模型。模型不考虑影响人口数量的各种复杂的因素,把人口数量看作是一个灰色的过程,从人口数量的变动外在现象中,挖掘出人口数量的内部规律,研究人口数量的内部规律,从而对其未来人口数量的变化及发展规律做出预测。
从中国统计年鉴查得2004年至2013年中国人口总数量数据如表4-1所示
表4-1中国近10年的人口数量(万人)
Table 4-1 nearly 10 years of Chinese population (ten thousand people)
| 年份 | 2004年 | 2005年 | 2006年 | 2007年 | 2008年 | 2009年 | 2010年 | 2011年 | 2012年 | 2013年 |
| 人口数量 | 129,988 | 130,756 | 131,448 | 132,129 | 132,802 | 133,450 | 134,091 | 134,735 | 135,404 | 136,072 |
x=2004:1:2013; y=[129988 130756 131448 132129 132802
133450 134091 134735 135404 136072]; plot(x,y.*10^4)
图4-2中国近10年的人口数量(万人)
Figure 4-2 nearly 10 years of Chinese population (ten thousand people)
年份
由本文的图4-2数据可知,我国人口数量在近十年之内正处于稳定缓慢增长中,为保证原始数据的相对平稳性和相似性,在建立模型时所选用的数据为2009年以后的数据,另外,由于国家统计部门还未公布2014年的相关人口数量的统计数据,因此本文在建模时不考虑去年的数据。数据如表4-2所示
表4-2中国近5年的人口数量(万人)
Table 4-2 nearly five years of Chinese population (ten thousand people)
| 年份 | 2009年 | 2010年 | 2011年 | 2012年 | 2013年 |
| 人口数量 | 133450 | 134091 | 134735 | 135404 | 136072 |
原始序列
第一步,对累加生成序列 ,得
=
=(133450,267541,402276,537680,673752)
第二步 对做均值生成,并将值带入矩阵中
第三步 对参数进行最小二乘法估计: 利用matlab计算。
Matlab的程序如下:
B=[-200495,1;-334908,1;-469978,1;-605716,1];
Y=[134091;134735;135404;136072];
format long
inv((B'*B))*B'*Y
可得发展灰色[15],内生控制变量,则对照表3-2模型适用条件可知,发展系数,模型可做中长期预测。根据以上数据,结合建模方法,可得时间相应函数:
(4-1)
结合公式
-,
即可对数据进行原始序列的模拟序列。
第四步 求模拟序列,所预测的数据用matlab[14]实现如下:
k=1:5;
y=27324228.78012724*exp(0.00451833*k)-27190778.78012724
得出近似解
表4-3 给出了基于以上公式的模拟序列数据。
表4-3 实际值与预测值
Table 4-3 Comparison of actual and predicted values
| 年 份 | 2009 | 2010 | 2011 | 2012 | 2013 |
| 实际值/万人 | 133450 | 134091 | 134735 | 135404 | 136072 |
| 预测值/万人 | 133450 | 134085 | 134743 | 135404 | 136069 |
x=2009:1:2013;
y1=[133450 134091 134735 135404 136072];
y2=[133450 134085 134743 135404 136069];
plot(y1,'*';y2,'+')
图4-2 实际值与预测值比较
Figure4-2 Comparison of actual and predicted values
*:实际值 +:预测值
4.2.2 模型的检验
(1) 残差检验
记为原始数列与预测数列的绝对误差数列,其中,相对误差,拟合精度,若能控制在8%以内,则可认为模型通过残差检验。
由表4-3可知,我国人口数量预测模型的相对误差均小于1%,平均残差为0.0025%,拟合精度为99.9975%,根据残差检验标准可知,该模型通过残差检验。
表4-4 2009-2013年人口数量残差检验
Table 4-4 2009-2013 China's population total quantity prediction residual test
| 年份 | 2009 | 2010 | 2011 | 2012 | 2013 |
| 实际值/万人 | 133450 | 134091 | 134735 | 135404 | 136072 |
| 预测值/万人 | 133450 | 134085 | 134743 | 135404 | 136069 |
| 绝对误差/万人 | 0 | 6 | 8 | 0 | 3 |
| 相对误差/% | 0 | 0.0045 | 0.0059 | 0 | 0.0022 |
经计算可得: =0, =8,因此原始序列的每一项与所对应的预测序列的每一项值的关联系数(k)为
,可以得到所要求的关联度为,可认为通过关联度检验。
(3) 后验差检验
原始序列的标准差为,绝对误差的标准差为,方差比,,
(3.2, 2.8,4.8,3.2, 0.2)均小于,因此,,根据后验差检验判断标准可知,模型通过后验差检验,图4-2描绘了我国人口数量预测的实际值与预测值的比较情况。根据模型检验显示,建立的预测模型较好,预测准确。因此,应用模型能较好地预测近几年人口数量的增长趋势。经过验证模型在未来的几年内可以用来做中国人口数量的预测。将k值依次向下取值,然后再用还原公式,即可求得2014年至2015年的预测值如表4-2所示。
表4-2 我国人口数量预测表
Table 4-2 Our country population forecast table
| 预测年份 | 预测人口数量/万人 |
| 2014 | 136740 |
| 2015 | 137400 |
中国的人口问题较大,现在已经进入以老龄化严重和生育率很低为首要特征的阶段。尽管中国人口数量仍居于世界第一,但人口的结构已经发生了很大的转变。2013年,我国推出了生二胎,但是直到今日,生二胎仍未全面实行。本文预测的是2014年及2015年年末人口总数量,不考虑生二胎的开展,以及人口老龄化等复杂因素。
根据以上模型精度检验预测的结果可知,本文所得到的模型是可靠的,可以用来预测我国人口数量。由模型预测可知2014年和2015年的人口数量预测值分别为136740万人,137400万人。在此文中我选用的数据来自于中国统计年鉴,一共有十个人口数量的数据,而我在选择时,是从2009年一直到2013年的五个数据,将2009年一直到2013年的五个数据与预测出的结果相比较,两者比较,两者的结果相差小于0.01%。研究结果表明灰色模型在一定程度上能反映出人口数量的变化规律。
参考文献
[1] 沈建国.灰色模型的改进及其应用[M]. 数学的实践与认识,1990.
[2] 于晓秋.区域农业资源信息的分形应用和产量模型的修正拟合[D]. 东北农业大学, 2003.
[3] 邓聚龙.灰色系统理论教程[D]. 武汉:华中理工大学出版社.1990.
[4] 冯利华.灰色系统模型的问题讨论[D]. 系统工程理论与实践,1997.
[5] Xu Zhongxiang,Wu Guoping.Grey comprehensive relational positioning prediction Of copper-nickel mineral deposits[J]. The Journal of Grey System,1996.
[6] 刘希强.灰色GM模型及其应用[J]. 系统工程理论与实践,1995,15.
[7] 李万绪.基于灰色关联度的聚类方法及其应用[J]. 系统工程,1990,8.
[8] 徐恒振.灰色关联度聚类分析在油鉴别中的应用[J]. 中国环境科学,1995,15.
[9] 姚向东,张立军.灰色预测控制的设计及其应用[M]. 电子与自动化,1998.
[10] 宋忠民.灰色函数的连续性质[J]. 烟台大学学报,2000,13.
[11] 黄元亮,潘冰.基于灰色模型的系统半定量关联矩阵[J]. 系统仿真学报.2007年3期.
[12] 灰色预测方法在山东省粮食总产量预测中的应用[M]. 水土保持研究.2006年第13卷第2期.
[13] 褚春雷.几种方法在粮食产量预测中的比较研究[D]. 河南大学,2008.
[14] 罗军辉,冯平等.MATLAB 7.0在图像处理中的应用[M]. 北京:机械工业出版社,2005.
[15] JIN Zhi-Qing and ZHU Da-Wei.Impacts of Changes in Climate and Its Variability on Food Production in Northeast China[J]. ACTA AGRONMICA SINCA.2008(34).
[16] [美]莱斯特布朗.布莱恩霍韦尔.中国缺水将动摇世界粮食安全[J]. 战略与管理,1998(6).
[17] 马晓河,蓝海涛.中国粮食综合生产能力与粮食安全[M]. 北京.经济科学出版社,2008.
附录A译文
鱼雷使用维护费用的模糊灰色预测模型
梁庆卫,赵民全,杨璞
(西北工业大学航海学院,西安 710072)
摘 要
选取某型鱼雷连续数年的使用维护费用建立灰色模型,为解决不同时刻的历史数据对模型预测结果影响不同的问题,对原始数据列进行了模糊化处理,同时通过弱化缓冲算子处理减弱了数据的随机性。通过实例仿真结果表明,该方法具有更高的预测精度,具有使用价值。
关键词:鱼雷;使用维护费用;弱化缓冲算子;灰色模型
1 引言
鱼雷有几个特点,如采购成本高,不可再利用。据统计,武器维修费用通常为采购成本的三到二十倍。鱼雷的维护成本是惊人的。这对于设备的运行管理,资金管理,准确和迅速地预测未来几年内鱼雷的维修费用是非常重要的。在本论文中,我们首先建立灰色模型,然后,我们改善这一模型,在这种情况下得到灰色模型的固有缺点和鱼雷的维修费用的检视模型。
灰色预测模型有信息较少、更高的精度优势。而且我们也不需要考虑相关因素。通常情况下,预测将受两个因素影响。首先,我们不能合理确定原始数据的长度,精度会受到影响,不是太短就是太长,二是外界干扰会减少原始数据的大量信息,在时间序列中,数据越“旧”,价值越少。灰色模型中的所有信息都是等价的。对于第一个问题,我们可以利用灰色代谢模型改善它。这意味着,删除最原始的信息,增加新的信息,以保持相同的模型数据。对于第二个问题,给出模型新信息的大量成员。但是,历史数据对系统层面的影响是模糊的,并且定量的信息很难获得。所以,我们把模糊理论应用到灰色模型。
2 模糊原始数据
原始数据序列已知:
(1)
在不同时期的历史数据对模型预测的影响不同,我们对该系列每个数据模糊。
然后我们得到一个模糊隶属函数的新序列
其中是对应于每一个数据的时间,时间紧密,更重要的是相应的数据,然后选择为的单调递增函数并且,
(2)
根据模糊权重值获取每个数据
(3)
然后得到权重序列
根据弱化缓冲算子的加权平均公式,我们可以得到模糊弱化缓冲影响的序列
(4)
其中
D 是正在弱化的缓冲算子
3灰色预测模型
经过1-AGO的数据序列(1),得到生成序列
其中
首先,准平稳测试的原始数据序列
然后使该序列光滑 is :
序列满足以下条件:
1)
2)
3) 。
那么是准平稳序列
此外,检验的准指数。
按此顺序排列成等比数列
当时,我们可以说该序列满足灰色指数
如果我们可以说该序列满足准指数,当通过准平稳测试并且通过准指数测试 该序列能够通过建立模型。如果测试不合格,通常的做法做平移变换,对数变换或者平方根变换,以确保处理可以通过测试序列。
3.2 模型
从数据数列, 建立背景值序列:
其中,
那么,是GM(1,1)模型。
在此公式中,a,b是模型参数,a被称为发展系数,其
大小反映了该序列的增长速度,b为载体的作用。伦敦证券交易所参数灰色微分方程向量满足:灰色微分方程的LSE 的参数向量
, Y=
灰色GM(1,1)模型的时间响应序列为
(5)
1-IAGO 数据序列, 对序列变为模糊灰色GM(1,1) 模型
3.3 精度检验
通常的测试方法是后差分方法。精度取决于MSE的比和小误差概率。MSE的比例越小和小误差概率越大,精确度越高。
基础模型如下:
假设 是原始数据序列,是模拟序列,剩余序列,那么,
在公式中,是的平均值;是的方差;是剩余的平均值; 是的方差;C是与的比。
根据公式和, 我们可以得到后差分的比C和小误差概率。
表一:后差分方法的标准测试
| ModelAccuracy class 1(Fine) 2(Qualified) 3(Barely passing) 4(Unqualified) |
| P 0.95≤p 0.80≤p<0.95 0.70≤p<0.80 p<0.70 C c≤0.35 0.35 |
序列满足以下条件:
4)
5)
6) 。
那么是准平稳序列
此外,检验的准指数。
按此顺序排列成等比数列
当时,我们可以说该序列满足灰色指数
如果我们可以说该序列满足准指数,当通过准平稳测试并且通过准指数测试 该序列能够通过建立模型。如果测试不合格,通常的做法做平移变换,对数变换或者平方根变换,以确保处理可以通过测试序列。
3.2 模型
从数据数列, 建立背景值序列:
其中,
那么,是模型。
在此公式中,a,b是模型参数,a被称为发展系数,其
大小反映了该序列的增长速度,b为载体的作用。伦敦证券交易所参数灰色微分方程向量满足:灰色微分方程的LSE 的参数向量
, Y=
灰色GM(1,1)模型的时间响应序列为
(5)
1-IAGO 数据序列, 对序列变为模糊灰色GM(1,1) 模型
3.3 精度检验
通常的测试方法是后差分方法。精度取决于MSE的比和小误差概率。MSE的比例越小和小误差概率越大,精确度越高。
基础模型如下:
假设 是原始数据序列,是模拟序列,剩余序列,那么,
在公式中,是的平均值;是的方差;是剩余的平均值; 是的方差;C是与的比。
根据公式和, 我们可以得到后差分的比C和小误差概率p
表一:后差分方法的标准测试
| ModelAccuracy class 1(Fine) 2(Qualified) 3(Barely passing) 4(Unqualified) |
| P 0.95≤p 0.80≤p<0.95 0.70≤p<0.80 p<0.70 C c≤0.35 0.35 |
使用多年维修费用的鱼雷模型如图所示
表二:维修费用单位:人民币10000(首个财政年度)
| year | 1 2 3 4 5 6 7 8 9 10 11 12 13 |
| costs | 55 55.5 55.7 56.5 58 60 67 71 77 85 94 101 110 |
首先,对所选数据的进行模糊处理。根据模糊隶属度的性质。不同长度的历史数据为基础,您可以选择不同的σ值,获取更多的数据,越小的σ值。在论文中,σ=0.8。
根据公式(2)及(3),我们得到的数据权重序列
ω=(0.115,0.117,0.124,0.134,0.149,0.168,0.192)(6)
替换成分子量序列(4),得到:
=(34.13, 37.01, 40.22, 43.73, 47.35, 50.80, 55)
=(34.13, 71.14, 111.36, 155.09, 202.44, 253.24, 308.24)
已通过准平稳测试,且通过准指数测试 该序列能够通过建立模型,并能得到时间反应函数:
根据这个模型,我们可以得到7-12年的数据的拟合值
= ( 34.13, 37.19, 40.23, 43.51, 47.06, 50., 55.04)
代入试验的公式,得到:
=6.96; =0.1556;C =0.0224;P =1。
据预测精度表,模型精度为1,本模型表明,该模型具有良好的预测性。根据该模型,我们可以预测第13年的维修费用是59.54。
删除最旧的数据,增加一个新的数据,以保持同样的模型数据,重新建模
和预测,我们可以得到未来几年的预测值。
4结论
在本文中,我们使用灰色系统理论预测鱼雷维修成本费用。对于灰色模型的两个常见的问题,我们的模型是通过对原始数据的模糊处理和新陈代谢的基础上的动态灰色模型是模型优化。该模型突出了历史数据在“最近的“数据到预测结果的影响。它保证了不断更新模型的样本数据。
附录B外文
Fuzzy Grey GM(1,1) Model of Maintaining Cost for Torpedo
Liang Qingwei, Zhao Minquan, Yang Pu
(College of Marine,Northwestern Polytechnical University,XiAn 710072)
Abstract: Establish the grey model of maintaining cost for torpedo, selecting the data for several years. To solve this problem that historical data at different time have different effects on the model prediction, processed raw data using fuzzy method. At the same time, weaken the randomness of the data by processing of weakening buffer operator. Simulation shows that this method is satisfactory.
Keywords:Torpedo;maintaining cost;Weakening Buffer Operator;GM(1,1) model
1.Introduction
There are several features of the torpedo,such as high procurement costs, longer using. According to statistics, maintenance costs of weapons is usually 3 to 20 times [1] to purchase cost. Maintaining cost of torpedo is staggering. It is important for equipment operating management and capital management,predicting the maintenance cost of torpedo the next few years accurately and quickly. In this paper, we establish grey model first, then, we improved the model, in view of this situation that the inherent shortcomings of grey model and the feature of torpedo’s maintenance costs.
Grey prediction model has the advantage, such as less information, higher precision. And we do not need consider the relevant factors. Usually, predictions will be affected by two factors. First, We can not reasonably determine the length of the original data, accuracy will be affected whether too short or too long; Second, The amount of information of the original data will decline by outside interference, in time sequence, the “old” data, the less value. All information in the grey model is equivalent. For the first problem, we can improve it using the grey metabolic model . [2][3] That’s means that remove the oldest information, increase a new information, to maintain the same model data. For the second problem, given the larger membership of new information in the modeling. But the impact of historical data on the system level is fuzzy, and quantitative information is difficult to obtain. So, we applied fuzzy theory into the grey model.
2.Fuzzy original data
The raw data sequence is known:
(1)
Historical data at different times has different impact on the model predictions, we give each data in the series a fuzzy. Then we get a new sequence by fuzzy membership function That is
Where is the time corresponding to each data; Time closer, the more important the corresponding data, then select as monotonically increasing function of,and.,selected
(2)
Get the weight of each data according to fuzzy-valued
(3)
Then get the weight sequence
Under weighted average weakening buffer operator formula,we can get the sequence affected by fuzzy weakening buffer.
(4)
Where
D is weakening buffer operator
3.Grey prediction model
2.1 Data Preprocessing
After 1-AGO to the data sequence (1), get the generate sequence:
Where,
First, quasi-smooth test the original data sequence
The smooth than of the data sequence is :
hen sequence satisfy these conditions below:
1)
2)
3)。
Then is Sequence of quasi-smooth.
Ferther,quasi-exponential test.
The grade ratio sequence
When, We can say that sequence meet the grey
exponential. If We can say that sequence meet quasi-exponential.
When, has passed quasi-smooth test, and has passed quasi-exponential test, thesequence can be modeled by GM(1,1) . If the test is unqualified, the usual approach is transforming Translation transformation; Logarithmic transformation; Square-root transformation, and make sure the sequence processed can pass test.
2.2 model
From the data sequence , construct background value sequence:
Where,
Then, is the model.
In this formula, a,b are model parameters, a is called the development coefficient, its
size reflects the growth rate of the sequence, b is the role of vector. LSE parameters vector of grey differential equation meet:
, Y=
The time response sequence of grey model is:
(5)
1-IAGO to the data sequence, get fuzzy grey model to the sequence
2.3 Accuracy test
Usually the testing method is posterior difference method. Accuracy is determined by MSE
ratio and small error probability. The smaller the MSE ratio and the bigger the small error
probability, The higher accuracy
The basic method is as follows:
Suppose is the raw data sequence, is simulation sequence, is residual
sequence,then
In the formula: is the mean of; is the variance of; is the mean of residual; is the variance of; C is the ratio of to。
According to the formula and, we can get the
ratio C of posterior difference and small error probability p.
Tab. 1 The standard test of posterior difference method
| ModelAccuracy class 1(Fine) 2(Qualified) 3(Barely passing) 4(Unqualified) |
| P 0.95≤p 0.80≤p<0.95 0.70≤p<0.80 p<0.70 C c≤0.35 0.35 |
4.Example
The use of maintenance costs over the years to a model of the torpedo as shown.
Tab. 2:Maintenance Cost Unit:10 000 RMB¥,(first fiscal year)
| year | 1 2 3 4 5 6 7 8 9 10 11 12 13 |
| costs | 55 55.5 55.7 56.5 58 60 67 71 77 85 94 101 110 |
importance of new information, we should try to use the new data in the establishment of model.
So, Select the data of 7-13 years. The sequence after deducting fixed costs 550,000 yuan is:
First, fuzzy processing of the data selected. According to the nature of fuzzy membership.
Different length based on historical data, you can select a different value σ .More data, the less
value σ . In the paper, σ =0.8.
According to the formula (2) and (3), we get the weight sequence of the data sequence
ω =(0.115,0.117,0.124,0.134,0.149,0.168,0.192) (6)
Substitute the weight sequence into formula (4), get:
=(34.13, 37.01, 40.22, 43.73, 47.35, 50.80, 55)
=(34.13, 71.14, 111.36, 155.09, 202.44, 253.24, 308.24)
has passed quasi-smooth test, and has passed quasi-exponential test, the sequence can be modeled by GM(1,1) . And get time response function:
According to the model, we can get the data’s fitted values of 7-12 years.
= ( 34.13, 37.19, 40.23, 43.51, 47.06, 50., 55.04)
Incorporated into the test formula, get:
=6.96; =0.1556;C =0.0224;P =1。
According to the prediction accuracy table, the model accuracy is 1.This shows that the model has good predictive. We can predict that the maintenance cost of 13th year is 59.54
according to the model.
Remove the oldest data, increase a new data, to maintain the same model data, Re-modeling
and prediction, we can get predictive value of the next few years.
5.Conclusion
In this paper , we use grey system theory for torpedo maintenance cost forecasting. For two
common problems to grey model, our model is optimized through fuzzy processing of raw data
and the dynamic grey model on the basis of metabolism. The model highlights the affect of
historical data in the "recent" data to the predicted results. And it assured the sample data of the
model continuously updated.
