标题 | SOx、NOx、PM10浓度的时间序列模型及其残差T2控制图 |
范文 | 卢虎生 甄建静 摘 要:利用统计学软件,对内蒙古包头市2012年1月1日~2012年12月31日市环境监测站的SOx、NOx、PM10日浓度数据,进行了时间序列分析,并建立了时间序列模型(ARIMA)。然后对模型进行识别、估计,并对估计后的残差进行检验,经检验后的SOx、NOx、PM10浓度的残差值均为白噪声序列,则计算出相应的SOx、NOx、PM10日浓度的残差值。由于残差值满足传统的统计过程质量控制理论中的统计量彼此独立的基本假设,因此我们绘制出多元自相关过程的残差T2控制图。实例应用表明,该方法是合理科学的。 关键词:ARIMA模型;时间序列;残差T2控制图 0 引言 我国环境监测总站公布各大主要城市空气质量日报已有多年的历史,它是认识和研究大气环境质量的一种方法,它不仅仅给人们的生活带来了很大的便利,同时也给各相关部门制定相关的环境政策提供了参考依据。而今,随着工业化和商业化的加剧,大气环境质量也越来越差,这就亟需对城市大气环境质量进行客观、实时的评价。目前,我国的城市质量日报常规检测的几种空气污染物为SOx、NOx、PM10浓度,监测数据的取位主要依据所使用仪器的精度和分析方法的最低检出浓度的有效数字所能达到的位数确定[1,2]。 到现在为止,许多统计方法和计算机应用技术应用于大气环境质量评价中,如模糊数学的综合评价方法[3],找到了影响空气质量的主要污染因子,并为降低和防治大气污染提供建议;GIS技术[4],实现了大气环境模拟与评价结果的可视化管理;灰色系统预测模型[5],通过实例的运用表明模型具有实用价值等,而文献[4]采用时间序列分析方法[6],对西安市2004~2008年PM10月平均浓度时间序列数据建立自回归滑动平均模型模拟实测的PM10浓度,并对模拟结果进行了检验。文献[6]绘制多元自相关[7]过程的残差T2控制图,并且通过蒙特卡洛模拟得出残差T2控制图能有效控制出现大偏移的多元自相关过程。但是,几乎没有人将环境空气质量数据用于自相关残差控制图的绘制。包头市环境质量年报公布的2012年1月1日~2012年12月31日的市环境监测站的SOx、NOx、PM10浓度随时间的推进发生改变,并且存在自相关的现象,通过相关监测值建立时间序列模型,以历史资料进行参数估值后便可以计算该监测指标的残差,从而建立残差T方控制图[8,9]。时间序列模型分为:自回归(AR)模型、移动平均(MA)模型、自回归移动平均(ARMA)模型、自回归综合移动平均(ARIMA)模型等。 1 ARIMA时间序列模型 ARIMA是自回归移动平均结合(Auto Regressive Integrated Moving Average)模型的简写形式,其应用范围很广泛,但它只限于考虑平稳的时间序列或者是经过差分后平稳的时间序列。 (1)自回归模型(autoregressive, AR) 一个p阶自回归模型AR(p)可表示如下: X■=?准■X■+?准■X■+…+?准■X■+u■, 其中?准i, i = 1, … p 是自回归参数,u■是白噪声序列,X■是由它的p个滞后变量的加权和以及u■相加而成。 (2)移动平均模型(moving average,MA) 一个q阶移动平均过程模型MA(q)可表示如下: X■=u■+?兹■u■+?兹■u■+ … +?兹■u■=(1+?兹■L+?兹■L■ + … +?兹■L■)u■=?兹(L)u■ 其中?兹1,?兹2, …,?兹q是回归参数,u■为白噪声序列,之所以称"移动平均",是因为X■是由q+1个u■和u■滞后项的加权和构造而成。"移动"指t的变化,"平均"指加权和。 (3)自回归移动平均模型(autoregressive moving average,ARMA) 由自回归和移动平均两部分共同构成的随机时间序列模型就成了自回归移动平均模型,记为ARMA(p, q), 其中p, q分别表示自回归和移动平均部分的最大阶数。ARMA(p, q) 的一般表达式是 X■=?准■X■+?准■X■+…+?准■X■+u■+?兹■u■+?兹■u■+...+?兹■u■ 自回归移动平均模型(ARMA)是随机时间序列分析模型的普遍形式,自回归模型(AR)和移动平均模型(MA)是它的特殊情况。 当然,这些模型只适合于平稳的时间序列,如果一个时间序列是不平稳的,那么首先应该把它转换成一个平稳的时间序列,常用的转换方法是差分,用公式表示就是: ▽X■=X■-X■,▽■X■=▽▽X■ 把上面三个方法结合在一个模型中就成了ARIMA(p,d,q)模型。其中p表示被回归项的滞后期数,q表示随机干扰项的滞后期数,而d表示差分的阶数。 2 SOx、NOx、PM10浓度时间序列数据的模型拟合及控制图分析 本文选取了内蒙古包头市五个监测站的SOx、NOx、PM10浓度数据进行模型拟合以及控制图的绘制。每个监测站的每个监测项目都是从2012年1月1日~2012年12月31日的日浓度数据,共366个观测值。下面主要以市环境监测站的SOx、NOx、PM10的浓度数据进行分析。 图1是内蒙古包头市SOx日观测浓度的时间序列,基本可以看出其是一个非平稳的序列。利用EVIEWS7.0软件对原序列进行ADF单位根检验,ADF值为-2.318584大于1%的置信度水平,接受原假设,得知该时间序列含单位根,也即该序列是一个非平稳的时间序列。为了消除非平稳性,对原序列进行一阶差分处理,并对差分后的数据进行ADF单位根检验,ADF值为-9.474383小于1%的置信度水平,拒绝原假设,得出一阶差分后的时间序列不含单位根,是一个平稳的序列。因此初步断定为ARIMA模型,并且模型的参数d=1。 接下来我们需要做SOx一阶差分数据模型的识别和检验,即确定模型的类型以及相应的阶数。绘制这个序列的ACF和PACF图,如图2所示,从图中可以看出,自相关函数在滞后2阶处截尾,偏自相关函数呈指数衰减,并且衰减的速度比较快,符合拖尾的特征,根据AIC准则和其他如参数显著性检验,本文选取了ARIMA(0,1,2)模型。 对SOx浓度时间序列ARIMA(0,1,2)模型进行最大概似估计,估计结果为:模型的标准误差比较低,模型的精度较高,且模型的两个因素MA1、MA2均能在0.05的显著水平下通过检验。 对此模型的残差进行检验,模型的残差都在置信区间范围内,可认为与0无明显差异,已基本上消除了自相关和偏自相关,表明残差序列是白噪声,也即残差序列是服从正态分布并且独立的。 综合上述分析可以得出结论,利用ARIMA(0,1,2)模型对SOx浓度时间序列建模是合适的。 通过建立上述模型,可以计算出SOx浓度时间序列模型的残差值,暂且存储在minitab软件中。 内蒙古包头市环境监测站的NOx、PM10的浓度数据的模型拟合方法、步骤和上面对SOx浓度数据的时间序列分析基本一样,在此不再详细的分析过程,仅将最后的残差计算同SOx浓度时间序列模型的残差计算结果存储在minitab16软件中,由于篇幅所限,在此仅提供部分残差值数据如表1所示。 由于SOx、NOx、PM10浓度时间序列残差数据是白噪声序列,各自浓度数据独立且服从正态分布,并且两两之间通过SPSS17.0软件做残差变量间的相关性分析得知存在相关性,符合传统统计过程控制理论中统计量彼此独立的基本假设,也同时满足多元T2控制图的变量间相关的条件,由于篇幅所限,在此不列出残差T2控制图的统计量、上控制限以及判断过程是否出现异常的准则,直接绘制SOx、NOx、PM10浓度时间序列模型的残差控制图,如下图所示: 由以上的残差控制图我们可以看出出界点有5个,分别为:12.4.26、12.10.11、12.12.2、12.12.12、12.12.26这5个日期。 3 结论 本文选取内蒙古包头市五个监测站中的市环境监测站的SOx、NOx、PM10浓度的日观测资料时间序列,应用最大概似估计,进行ARIMA模型的拟合和控制图的绘制,结果表明在模型的拟合方面取得了较好的效果。 由于选取的是内蒙古包头市市环境监测站的日观测SOx、NOx、PM10浓度时间序列数据进行估计,并且每个浓度的分析结果都令人满意,因此应该可以说明其余监测站的SOx、NOx、PM10浓度资料都适合这种ARIMA模型的拟合。只是在进行拟合时,应对SOx、NOx、PM10浓度资料进行详细地分析以得到最好的效果。因为虽然都是SOx、NOx、PM10浓度资料,但是每个监测的每个浓度的ARIMA模型的参数或许会不一样,即其中的参数p、d、q可能完全不一样。 值得说明的是,时间序列ARIMA模型所描述的是时间序列的短期变化关系,而不是长期变化关系,因此,利用时间序列模型可以进行对监测站日观测SOx、NOx、PM10浓度数据的短期预测。 参考文献: [1]瞿德业,周围,陈雷华,汪君,鹿晨昱.兰州市城区空气气溶胶中PM2.5和PM10污染状况分析[J].干旱区资源与环境,2013,27(1):70-74. [2]郭勇涛,佘峰,王氏功,刘炳杰,李江萍,王金艳.兰州市空气质量状况及与常规气象条件的关系[J].干旱区资源与环境,2011,25(11):100-105. [3]郑健.2001-2011年乌鲁木齐市大气环境质量模糊数学综合评价[J].环境污染与防治,2014,1(36):28-33. [4]郭东恩,沈燕,张峰.GIS技术在大气环境模拟与评价系统中的应用探讨[J].测绘科学,2011,36(5):100-102. [5]戴华炜,陈小旋,孙晓通.基于GM(1,1)模型群的深圳市大气污染物灰色预测[J].数学的实践与认识,2014,44(1):131-136. [6]樊敏,顾兆林.时间序列分析在大气环境中的应用[J] .资源环境与发展,2010,1:19-22. [7]Seoung Bum Kim, Weerawat Jitpitaklert, Sun-Kyong Park,Seung-June Hwang. Data mining model-based control charts for multivariate and autocorrelated processes [J].Expert Systems with Applications,2012, 39:2073-2081. [8]孙静,杨穆尔.多元自相关过程的残差T2控制图[J] .清华大学学报(自然科学版),2007,47(12):2184-2187. [9]S.Bersimis, S.Psarakis and J.Panaretos. Multivariate Statistical Process Control Charts: An Overview [J].Research, 2007, 23:517-543. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。