摘 要:针对季度工业经济效益综合指数具有增长性和波动性的二重趋势,首先对该指标建立GMDH自回归模型和AC模型,然后用基于误差平方和最小的多元回归方法对各单一模型的预测值进行组合,得到最优模型。同时将组合预测结果与工业经济效益综合指数实际值以及GMDH、AC单一模型的预测结果相比较。进一步显现出组合预测模型在工业经济效益预测中的优势。从而为工业经济效益的预测提供了一种行之有效的方法。 论文关键词:工业经济效益综合指数;AC模型;GMDH自回归模型;组合预测 1 GMDH自回归模型原理 GMDH是由乌克兰科学院A.G.Ivakhnenko院士于1967年首次提出,并在Adolf Mueller等德国科学家的协作下得以不断发展,如今已成为一个有效而实用的数据挖掘工具。自组织建模的过程实质上是寻求并确定系统最优复杂度模型的过程。它处理的对象为若干输入变量,一个或多个输出变量构成的变量间关系待定的一个封闭系统。通过各输入变量相互结合产生众多候选模型集,利用外准则选出若干项最优模型,再将其结合,由此得到再下一代。如此不断重复直到新产生的模型不比上一代更加优秀为止,则倒数第二代中的最优模型就是我们寻找的最优复杂度模型。 GMDH是基于神经网络和计算机科学的迅速发展而产生和发展起来的。类似于生物神经网络,自组织建模方法将黑箱思想、生物神经元方法、归纳法、概率论、Godel数理逻辑等方法有机地结合起来,实现了自动控制与模式识别理论的统一。 2 AC模型原理 2.1 待选模式的产生 对于一个给定的具有N个观察值的实值m维序列xt={x1t,Λxmt}(t=1,2,Λ N),一个模式定义为从第i行开始的含有k行的表格Pk(i),这里k称为模式长度(i=1,2,Λ,N-k+1)。 将所有可能的待选模式Pk(i)(i=1,Λ,l,Λ,N-k+1)与参照模式PR相对比,希望找出与参照模式相似的模式来研究系统的行为。根据任务的不同,参照模式可以是任何特定的模式。由于AC算法将相似模式的延拓组合起来作为参照模式的发展状态,因而该方法进行预测时,应该使预测区间恰好是参照模式的延拓。于是选用预测起点前的最近一个已知模式作为参照模式,即取PR=Pk(N-k+1)。 2.2 待选模式的变换 根据工作原理,对于长度为k的某参照模式,在数据样本中可能有一个或几个长度为k的相似模式。但是由于系统是动态的,不同时期的相似模式可能具有不同的平均值和标准方差。 令x*1,i+j=ai0l+ai1l,j=0,1,Λ,k-1;i=1,2,Λ,N-k+1;l=1,2,Λ,m参数aiol可解释为参照模式与相似模式Pk(i)间的状态差异,而参数ai1l则视为一些不确定的因素。使用参照模式的对应数据xij(i=N-k+1,N-k+2,Λ N;j=1,2,Λ m)作为基准值,对每个待选模式pk(i),由最小二乘法估计出未知的权重aiol,ai1l,并给出用于计算模式相似性度量的误差平方和。 2.3 相似模式的选取 这一步的主要目的是识别模式形状间的相似性,我们将其度量称为模式相似度。为了度量一个已按步骤(2)变换了的待选模式pk(i)关于参照模式pR的相似性,就需要测量两个模式中具有m个系统变量的k个观察值之间的距离。一般地,第i个待选模式与参照模式间的距离可定义为: di=1k+1k-1j=0mr=1xj,i=j-xr,N-k+j+12 模式相似度可由距离来度量。第i个模式关于参照模式的相似度si定义为: si=1/di 显然距离值越大,模式相似度就越小。 模式相似度计算出来以后,我们就可以根据相似度大小来选取相似模式。 2.4 将相似模式的延拓进行组合以得到预测 值得注意的是,与通常的参数模型相比,在对输出变量进行预测时,AC算法不需要预先对输入变量的发展趋势进行估计或作假设,即预测完全由一致的数据给出,是真正意义上的预测。这也是它优于一般预测方法的特点。 3 组合预测模型 所谓组合预测,就是将不同的预测方法进行适当的组合,综合利用各种方法所提供的有用信息,从而尽可能的提高预测精度。2003年诺贝尔经济学奖得主、美国加利福尼亚大学的C.Granger教授关于组合预测的评价是:“组合预测提供了一种简便而实用的可能产生更好预测的途径。” 假设对工业增加值预测问题建立了m个预测模型,他们对目标变量的预测值分别为f1(t),f2(t)L fn(t),组合预测模型为f(t)=∑ni=1ωifi(t)+c。 其中,c为常数,ω1,ω2,ω3,L,ωn为各种单项预测方法的预测值在组合预测中的权重。常数c和权重ωi(i=1,2,…n)的确定是根据最小二乘法原理,是预测值和实测值误差的平方和达到最小而求出。 4 实证分析 4.1 组合预测结果及误差分析 把2007年1季度~2007年4季度的GMDH模型和AC模型的相关数据代入组合预测的线性模型式中,即可求得组合预测的权重。在此组合预测模型下,可使预测的误差平方和最小,解得 ω1=4.979,ω2=-7.019,c=482.877 由此得到GMDH和AC预测模型及组合预测模型的相对误差分布见表1。 由表1可知组合预测之后,模型的相对误差大大减小了,模型的最大相对误差也在3%以内,属于宏观经济预测可接受的误差范围。 5 结束语 论文讨论了GMDH自回归模型和AC模型在工业经济效益中的作用,并针对两种预测模型的结果建立了最优线性组合预测模型。实例证明,组合预测取得了比较好的预测效果。 随着我国工业的快速发展,社会各界对于工业经济效益的预测工作越来越重视。论文借助GMDH自回归模型和AC模型进行组合预测,经过验证,该种方法能够有效地提高预测的精度,比单一预测模型的相对误差更小,更适合预测未来经济的发展。 用本文所提出的组合预测方法进行工业经济效益的预测已经在四川省得到应用。实践证明,这种组合预测方法的预测效果很好。 参考文献 [1]贺昌政.自组织数据挖掘与经济预测[M].北京:科学出版社,2005. [2]周鹏.中国宏观经济预测模型算法及应用[J].大连理工大学学报,2004