基于ARIMA模型的工业生产指数预测分析
赵梦鸽 李林
摘 要:运用自回归移动平均结合模型,即ARIMA法分析电力燃气工业生产指数时间序列上的趋势性规律,并进行预测。首先,对2000—2019 年的电力燃气工业产值指数数据进行时间序列分析以及平稳性处理。其次,通过模型的识别、诊断和检验,建立电力燃气工业生产指数数据ARIMA模型,预测模型ARIMA(2,1,3)(2,1,1)12。最后,根据得到的ARIMA(2,1,3)(2,1,1)12模型对2018—2019年的电力燃气设施数据进行预测,并将该模型预测结果与实际情况进行对比分析。结果表明,ARIMA 模型比较适用于随机性较大的电力燃气工业产值指数的趋势预测,并且方法简单。
关键词:时间序列分析;电力燃气工业生产指数;ARIMA 模型;趋势预测
中图分类号:F424? ? ? ? 文献标志码:A? ? ? 文章编号:1673-291X(2020)03-0030-07
引言
宏观经济研究有许多指标,其中工业生产指数常被用来预测工业经济的发展趋势。工业生产指数最早由美国联邦储备局于1922年12月编制,英、德、日等国紧随其后,也开始陆续编制了工业生产指数。如今工业生产指数已成为世界各国研判经济发展最强有力的指标,其中美国将工业生产指数作为反映经济周期波动的重要标志,工业生产指数的上升幅度和下降幅度能够准确地反映美国经济增长和衰退的程度而在各个领域的工业产值中[1]。而电力燃气是全社会消费的基本商品,一个国家或地区的电力消费是反映一国或一个地区总的经济水平的重要方面[2]。因此,准确地跟踪预测电力燃气未来工业总产值的发展趋势,适时调整工业总产值指数,以使国民经济健康有序的发展,就显得尤为重要。
近年来,我国也对工业生产进行了一些研究。2006年,姜庆华和赵丽萍应用ARIMA模型,对我国电力生产进行了预测研究[3];2011年,张磊和李慧民研究了ARIMA模型在我国建筑业总产值预测中的应用[4];李春林和王会岩基于干预ARIMA模型,对我国工业生产指数进行了预测[5];2012年,王蔚杰基于ARMA模型,并以我国工业生产总值指数为例,对经济发展的预测进行了研究[6];2016年,李孟刚等基于ARIMA神经网络模型,对工业生产指数进行了仿真研究[1];2017年,高鹏飞和段明圆利用残差修正 GM(1,1),对上海未来三年工业产值进行预测[7];2019年,李琛、郭文利等就基于BP神经网络,对北京夏季日最大电力负荷进行了预测[8]。综合以上文献可以发现,残差修正 GM(1,1)预测模型未考虑到数据的季节性,神经网络模型虽然能够挖掘出变量间复杂的难用数学式表达的非线性关系,但它的不足是对线性数据的效果不如ARIMA模型。对于非平稳的时间序列,普通的ARIMA模型通过d阶差分已能很好地模拟其变化规律。但是,在处理存在明显的季节性周期性变化的季节性序列时,乘积季节ARIMA模型是常用模型之一,该模型不仅考虑了不同周期中相同周期点之间的相关性,还考虑了相同周期内不同周期点之间的关系,通常比较符合时间序列观测数据的实际情况[9]。经初步判断,显然电力燃气产值是会随季节变化而变化的,所以本文选用ARIMA乘积季节模型进行研究。
一、ARIMA模型简介
(一)时间序列的平稳性分析
时间序列是依赖时间 t 的一组随机变量[4]。时间序列主要分为三类:一是纯随机序列(白噪声序列),这时候可以停止分析,因为毫无规律可循;二是平稳非白噪声序列,它们的均值和方差是常数,对于这类序列,有成熟的模型来拟合,如AR、MA、ARMA等;三是非平稳序列,一般都要先转化为平稳序列,再按照平稳序列的算法进行拟合。可以选择差分,如果差分后平稳可以用ARIMA模型拟合。差分阶数d和D可采用探究法和信息准则法常用来确定[10]。
(二)ARIMA模型原理
ARIMA模型有三种基本类型:自回归模型(AR(p):auto-regresison)、移动平均模型(MA(q):movingaverage)和自回归移动平均模型ARMA(p,q)。
(三)建立ARIMA预测模型
建立ARIMA模型进行预测的主要步骤如下:
1.对数据进行预处理。先是根据时间序列的散点图、自相关函数和偏自相关函数图初步判断平稳性,然后可以用 ADF即单位根检验去研究其方差、趋势性以及季节性的规律。如果一个序列的平均值和方差始终为常数,则称它为平稳的;反之,则判断该时间序列不平稳;如果自相关函数在前面少数几个值后下降为 0,则序列是平稳的;相反的,当自相关函数没有变为 0,只是依次降低,认为序列不平稳[14]。
2.对ARIMA模型的定阶并进行参数预判。通常时间序列经差分平稳后,由差分后序列的自相关、偏自相关函数图可以预估p、q和P、Q。
3.通过检验来诊断模型的合理性。通常选用拟合优度进行检验,对观测值以及模型拟合值的残差进行分析。当残差序列不是白噪声序列,则说明还有信息包含在相关的残差序列中未被提取,模型其他参数不能完全代表建模对象的统计性质,即所建模型不是最终模型,此时可对残差拟合更复杂的模型,以充分提炼资料的信息[15]。
4.采用已经建立的ARIMA(p,d,q)(P,D,Q)S模型做出預测。
二、工业产值指数ARIMA模型构建与应用
(一)变量及数据说明
运用好一种计量方法,数据支持十分重要。本文选取美国2000年1月至 2019年5月份电力燃气产值指数时间序列数据为样本,寻求适当的ARIMA模型,并做出相关预测。选取的变量电力燃气的工业产值指数用industral? production表示,单位为index2012=100(以2012年为基期计算的定基指数)。①
(二)工业产值指数ARIMA模型构建
1.数据平稳性处理。电力燃气工业产值指数数据2000—2019年的时间序列(见图 1)。
做原序列的自相关图(见下页图2)和偏自相关图(见下页图3),发现自相关图存在周期性的波动。下页表1是用ADF对数据的平稳性检验,由结果可见,序列的ADF=-2.4333,分别大于1%、5%、10%这3个水平的临界值,所以判断该序列确定是不平稳的。
由于原序列存在趋势性以及季节性波动,所以先对原始下页序列进行1阶差分和1阶季节差分。图4是差分后的序列图,可以粗略地判断是平稳序列。理论上,我们再次用ADF 检验,并得到下页表2。由表 2 可知,差分处理后得到新序列ADF =-7.49201,明显小于3个不同检验水平的临界值,判断此时数据平稳。所以,ARIMA模型中d和D分别为1。
2.模型的识别。差分后的平稳序列可以通过自相关,偏自相关图,初步确定 p、q 和P、Q的取值。由图5和图6可见,ACF图3阶截尾和PACF图2阶截尾,因此预判p=2,q=3。当仅观察时滞k=12(或4)和 24(或8)时,明显不是 0 的偏自相关数个数为P,显著不是 0的季节自相关数的数量为Q,因此P和Q分别取2和1。最后,初步确定所选取的模型为ARIMA(2,1,3)(2,1,1)12。
3.模型的诊断检验。首先,对已初步确定的ARIMA(2,1,3)(2,1,1)12模型的残差做自相关检验,得到相应的自相关图(见下页图7)。从图7中明显看到,残差的自相关函数和偏自相关函数基本都在95%的置信区域内。因此,可认为ARIMA(2,1,3)(2,1,1)12模型估计结果的残差序列不存在自相关。其次,对模型拟合统计结果(见下页表3),平均绝对百分误差(MAPE)为2.480在0—5范围内,R2高达0.895。综上所述,ARIMA(2,1,3)(2,1,1)12模型是合理的。
(三)模型的预测
根据上面的分析可知,本文建立的模型ARIMA(2,1,3)(2,1,1)12是合理的,可以用来进行预测。运用SPSS软件,利用上述模型,对2018—2019年的电力及燃气工业产值指数进行预测,并将ARIMA预测方法的预测值与实际电力和燃气工业产值指数进行对比。通过图8和下页表4的比较可以明显看出,模型的预测结果很好,其中一部分预测值与实际值的噪声残值很小,预测结果相对理想。
结语
本文用时间序列分析的ARIMA模型对电力燃气产值指数变化情况进行了预测研究,得到以下结论。
第一,乘积季节性ARIMA模型是针对有季节性变动的时间序列提出的基本又实用的建模方法,该模型全面考虑了序列的趋势及周期变化,并借助模型参数进行了量化表达,实用性很强,预测精准度高[16]。本文建立了结构为ARIMA(2,1,3)(2,1,1)12的模型,并且用该模型对2000—2019年电力燃气产值指数进行了分析,并预测了2018—2019年6月电力燃气产值指数的变化情况。模型预测结果显示,预测值与实际值的平均绝对百分误差(MAPE)为2.435,R2高达0.895,能很好地拟合原始序列的趋势性和周期性。
第二,乘积季节性ARIMA 模型是基于自回归和移动平均模型结合方法的进一步改进,对工业生产指数等一系列非平稳,趋势性或季节性明显的数据能做出相对准确的预测。但这种依靠单次分析构建的模型更适用短期预测。出于长期考虑,在实际工作中我们应不断地收集和更新时间序列数据对已经构建的模型进行检验和修正。只有通过不断修正或重新拟合预测模型,才能使模型更精确地反映当下实际情况。
参考文献:
[1]? 李孟刚,周长生,连莲,李文銳.基于ARIMA神经网络的工业生产指数仿真研究[J].计算机科学,2016,(S2):554-556.
[2]? 鲁从山.山东省社会用电量与生产总值指数的回归分析[J].山东电力技术,2001,(2):16-18.
[3]? 姜庆华,赵丽萍.基于ARIMA模型的我国电力生产预测研究[J].价值工程,2006,(9):113-116.
[4]? 张磊,李慧民.ARIMA模型在我国建筑业总产值预测中的应用[J].企业经济,2011,(11):93-96.
[5]? 李春林,王会岩.基于干预ARIMA模型的中国工业生产指数预测[J].统计与管理,2011,(1):73-74.
[6]? 王蔚杰.基于ARMA模型对经济发展的预测——以我国工业生产总值指数为例[J].中国外资,2012,(14):188-190.
[7]? 高鹏飞,段明圆.利用残差修正 GM(1,1)对上海未来三年工业产值进行预测[J].经济研究导刊,2017,(33).
[8]? 李琛,郭文利,吴进,金晨曦.基于BP神经网络的北京夏季日最大电力负荷预测方法[J].气候与环境研究,2019,(1):135-142.
[9]? 李焱,高强,王勇,刘欣然.乘积季节模型在软件老化评估中的应用研究[J].电子科技大学学报,2017,(3):583-587.
[10]? Peter J.B.,Richard A.D.TimeSeries:Theory and Methods[M].2nd ed.New York:Springer,2009.
[11]? 王一夫,陈松乔,陈安.[J].计算机工程与应用,2005,(19):170-173.
[12]? 张树京,齐立心.时间序列分析简明教程[M].北京:清华大学出版社,北方交通大学出版社,2003.
[13]? 李龙波.棉纺企业动态成本预测研究[D].贵州:贵州大学,2009.
[14]? 彭志行,鲍昌俊,赵杨.乘积季节模型在伤寒副伤寒发病预测中的应用探析[J].中华疾病控制杂志,2007,(6):560-563.
[15]? Dikey D.A.,Fuller W.A.D istribution of the estimators forauto-regressire time serieswith a unit root[J].Journal of theAmerican Statistical Association,2012,(74):427-431.
[16]? 李红,潘东峰,郭忠琴.时间序列模型在医院感染发生率拟合预测中的比较研究[J].中国卫生统计,2013,(1):87-89.