标题 | 基于贝叶斯理论和博克斯—詹金斯理论对比的江苏省就业预测研究 |
范文 | 傅坤 摘要:文章研究了基于Bayes理论和Box-Jenkins理论比较的系统建模方法,通过采用定性分析和实证实验结合的方式,从先验信息的使用、模型的产生机制等方面比较两個模型的异同,结合分析1991~2010年江苏省就业情况,从而对江苏省就业形势做出预测。 关键词:Bayes(贝叶斯)理论;Box-Jenkins理论;ARIMA模型;时间序列 一、时间序列 时间序列是指同一种现象在不同时间上的相继观察值排列而成的一组数字序列。时间序列预测方法本质上仍属于定量预测,因为它推测事务发展趋势的前提是默认事务的发展具有一定的延续性和规律性,这种延续性和规律性可以通过分析历史数据得出,并可延伸到未来,从而对该现象的未来做出预测。时序预测对资料要求比较单一,只需要变量的历史数据,同时模型相对简单,因此它广泛应用于金融、医学、水文、生物、计算机以及气象等领域,并日益显示出其强大生命力,成为一支独立的重要数学分支。 目前,时序的预测方法主要可以分为以下两类:1.线性时序预测,如传统的回归分析、博克斯-詹金斯预测模型等,这些方法大都属于统计建模方法,在理论上都比较成熟,但是要求时间序列具有平稳性、正态性、独立性,不太适合于复杂时间序列建模。2.非线性时序预测,如神网络模型(ANN)等,非线性方法以其模拟复杂系统的能力强越来越受到人们的重视。 二、两种预测方法基本原理 Box-Jenkins基本原理。Box-Jenkins法是以美国学者George Box和英国统计学家Gwilym Jenkins的名字命名的,也称为B-J法或ARMA方法,它将预测对象随时间变化形成的序列视作为依赖时间t的一组随机变量,它以自相关函数、偏自相关函数的统计特性为依据,来确定模型的类型,进而对模型进行定阶、参数估计、适应性检验、预测等,建立起适应序列的模型。 Bayes基本理原理。英国学者T·贝叶斯1763年在《论有关机遇问题的求解》中提出一种归纳推理的理论,后被一些统计学者发展为一种系统的统计推断方法,在样本或参数数据有限条件下,对部分未知的状态用主观概率推断(先验分布),然后用贝叶斯公式对发生概率进行修正(后验分布),最后再利用期望值和修正概率做出最优决策。 三、两种预测方法对比分析 (一)对系统先验知识的应用 作为建模可利用的信息,系统先验信息和样本信息是两个不同的方面。尤其在对复杂系统建模的时候,正确地利用系统的先验信息,往往可以大大降低模型的过程拟合,从而在很大程度上提高模型的预测能力。将系统的先验信息和样本信息结合,这是Bayes和B-J时序模型的最大相似之处,但是他们在先验信息的使用上有些区别。 Box-Jenkins时序预测法对于先验信息的运用远大于Bayes时序预测法,甚至可以直接运用先验知识选择参考函数和一些准则,而Bayes时序预测法在建立模型时,是将有限的先验分布信息和似然函数结合起来,先做出假定的主观概率预测,从而求得合理的模型参数,再利用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决策。 (二)模型产生机制 Box-Jenkins时序预测法是将时间序列看成是一个依赖于时间t变化的一组随机变量,虽然在此过程中某单个时序值具有不确定性,但整个序列的变化仍会呈现一定的规律性。B-J的基本思想是,这一串随时间变化而又相互关联的数字序列可以用相应的数学模型加以描述,可以从本质上掌握这些动态数据内在结构和复杂特性,从而达到在最小方差意义下的最佳预测。 Bayes时序预测法必须首先要依靠先验信息和似然函数假定出模型的结构,再利用贝叶斯理论进行相关推理。在整个推理过程中,模型结构是不变的。因此为了提高预测的效果,必须建立不同结构的贝叶斯时序模型,然后选择其拟合效果及检验效果较好的贝叶斯时序模型为最终的预测模型。 在建立Bayes模型的时候,其结构需要不停地根据拟合的结构进行变化,而B-J时序模型则没有这样的要求,这是二者的一个显著区别。 四、江苏省就业形势预测 (二)基于B-J时序模型的预测 根据江苏统计年鉴(2015)中1991~2010年江苏省的就业人口数和总人口数从总体变化数据统计,将其生成时序图如图1所示,总体趋势呈现较为平稳。 为了进一步判断该时间序列是否具有稳定性,通过EVIEWS软件对进行其单位根(ADF)检验,通过检验发现不存在单位根,即该组数据同阶协整,因此该时间序列平稳,可以通过自相关函数和偏自相关函数的统计特性,对该平稳时间序列进行识别,该序列的自相关函数图(ACF)和偏自相关函数图(PACF),如图2、图3所示。从图2和图3可以看出,ACF拖尾,PACF在p=5时候截尾,通过观察残差方差图可以发现,残差方差先按照一定幅度减小,当变化到第5次的时候为最小,因此可以初步判断AR(5)为比较合适的模型。 从该序列相关性检验结果来看,各个参数都通过了显著性检验,模型总体的统计显著性方差比检验也通过,自相关统计值DW为0.132876,可以认为序列不存在自相关,拟合优度的可决系数R2为0.770095,数值距离1有些差距,主要是因为其他一些客观原因,以及一些不确定因素的影响,总的来说,模型的统计检验可以通过。 (三)预测的比较 根据江苏统计年鉴(2017)资料显示,2015年、2016年江苏省就业人口数/总人口数分别是4758.50万人/7976.30万人和4756.22万人/7998.60万人,比较Bayes时序预测法和Box-Jenkins时序预测法两种方法预测结果,可以看出前者的误差比后者的误差稍高些,相比较而言,Box-Jenkins时序预测法的精确度稍微高一些。 五、结论 本文应用Bayes时序预测方法和Box-Jenkins时序预测方法两种建模的方法对江苏省就业人口数和总人口数(1991~2010年)数据建立时间序列模型,得出预测模型,两种建模方法均简单易行,但又有各自的优缺点,在考虑实际模型的时候,可以将二者有效的结合起来,吸取各自的优点。在就业形势越来越严峻的今天,这两种方法都具有较高的应用价值,所得出的数据均具有较高的参考价值。 参考文献: [1]王亮,刘豹.时间序列预测方法评述[J].预测,1991(04). [2]Damodar N.古扎拉蒂.Basic Economics(第三版)[M].中国人民大学出版社,2000. [3]陶靖轩.经济决策与预测[M].中国计量出版社,2004. [4]吴喜之.现代贝叶斯统计学[M].中国统计出版社,2000. [5]陈茜.贝叶斯预测模型的应用[J].黑龙江科技信息,2007(03). [6]张晓峒.计量经学软件EViews使用指南[M].南开大学出版社,2003. (作者单位:南京邮电大学) |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。