网站首页  词典首页

请输入您要查询的论文:

 

标题 基于NARX神经网络的粮食产量预测模型
范文

    李环 孙素芬 罗长寿

    

    

    

    摘要:中国是世界上重要的粮食生产大国,保证粮食产量和粮食安全关系到我国国民经济的健康发展。而做好粮食产量的预估工作,对于指导经济的健康发展十分重要。在借鉴相关研究成果和中国统计年鉴的基础上,选择7组与粮食产量相关的统计指标,并根据数据与粮食产量作出典型相关性分析,证明7组统计量与粮食产量之间的相关性,进而构建一种基于时间序列非线性自回归神经网络的粮食产量预测模型。经过检验发现,该模型的准确率和性能都取得较好的效果,在测试数据集上的平均误差为1.5%。

    关键词:典型相关分析;粮食产量预测;非线性自回归;时间序列

    中图分类号:F326.11文献标志码:A

    文章编号:1002-1302(2020)22-0228-05

    收稿日期:2020-02-09

    作者简介:李环(1994—),男,山西大同人,硕士研究生,主要从事农业工程与信息技术研究。E-mail:lh339966@163.com。

    粮食安全是支撑我国国民经济健康发展的重要力量,也是国家维护社会稳定的重要基石,还是保证国家长治久安的头等大事。其中,人均粮食占有量和粮食自给率是判断粮食安全程度的重要指标[1-2],所以分析我国粮食生产过程中的变化规律以及影响粮食生产的各种因素、掌握合理预测粮食产量的方法具有重要意义。当前国内外学者对粮食产量的预测进行了大量研究,并提出多种粮食产量的预测方法,其中较传统的预测方法主要有基于時间序列的预测方法[3]、滑动平均的预测方法[4]、多元线性回归的预测方法[5]。传统的预测方法虽然具有方法简单、便于操作的优点,但也存在预测值和实际粮食产量相差较大以及模型稳健性差的缺点,可见传统的粮食产量预测模型具有一定的局限性。随着人工智能和机器学习技术的发展,许多学者开始引进机器学习的方法进行粮食产量的预测,其中主要方法有基于支持向量机(SVM)的方法和基于BP神经网络的方法。宗宸生等建立一种改进粒子群优化神经网络的粮食产量预测模型,该模型是将普通BP神经网络与改进的粒子群算法相结合,并建立IPSO-BP模型[6]。该模型使用粒子群算法进行BP神经网络初始权重的优化,解决了传统BP神经网络模型权重参数优化容易陷入局部最优化的问题,但是该模型存在对粮食产量长期变化预测能力不足的问题。程伟等提出一种基于支持向量机的粮食产量预测方法,选用径向基函数作为核函数[7],并取得比传统多元线性回归、指数平滑模型和灰色模型更好的预测效果。但支持向量机更多的是应用在分类问题上,选择不同核函数对模型精度的影响较大,而如何选取正确的核函数须要进一步研究。因此,本研究提出一种基于时间序列非线性自回归神经网络(nolinearautoregressivemodels,NARX)的粮食产量预测模型,最终预测结果显示,非线性自回归神经网络结合时间序列模型后的预测效果较好,能够在我国粮食生产预测中提供有效的方式。

    1指标体系的建立

    1.1主要指标数据的准备

    构建粮食产量的预测模型首先须要设置模型的指标,本研究数据来源于《中国统计年鉴》(1978—2018年的数据,数据不包括港澳台地区),选取有效灌溉面积(x1n,千hm2)、化肥施用量(x2n,万t)、农村用电量(x3n,亿kWh)、农业机械总动力(x4n,万kW)、农业劳动力人数(x5n,万人)、粮食作物播种面积(x6n,千hm2)、受灾面积(x7n,千hm2)等7项数据与粮食总产量(yn,万t)进行相关性分析。

    在构建模型之前对数据进行预处理,将数据值映射到(-1,1)的区间中,即对数据进行标准化处理,进而可将有量纲数据转变为无量纲数据,用来消除量纲对最后回归结果的影响。本研究使用min-max标准化方法使运算后的结果映射到(-1,1)区间中,公式为

    1.2主要指标因素分析

    典型相关分析(canonicalcorrelationanalysis)是一种使用综合变量的分析方法,通过综合变量之间的相关关系反映2组指标之间的整体相关性的多元统计方法,在原来2组待研究的变量中提取2个具有代表性的变量(w和v的含义为2个待考察变量组的线性组合),利用这2个变量反映2组指标之间的相关性。

    此时,要寻求1组[WTHX]a和b的最优解,使得ρwv最大化,这样处理后得到的[WTHX]a和b就是使得w和v有最大相关性的典型系数。这时就可以用ρwv代替[WTHX]X和Y之间的相关性,从而达到降维的目的。a和b可以用SAS软件进行求解。

    由表3可知,原变量组x1n~x7n的综合变量w和yn的综合变量v之间的典型相关系数为0.9832233,具有很强的相关性,所以选出的统计变量可以用来预测粮食产量。

    2模型分析

    时间序列是一组按照时间顺序排列的数据,分析时间序列根据时间序列的数据进行曲线拟合和参数估计,是一种定量预测的方法。其基本原理包括:第一,承认事物发展过程中是延续不断的,即应用过去的数据就可以掌握事物的发展规律;第二,考虑事物发展的随机性,任何事物的发展都受到偶然因素的影响,所以用统计学原理对数据进行进一步加工处理。本研究粮食产量的预测模型中所使用的数据是时间序列,所以可以使用时间序列的统计方法构建时间序列模型(图1)。

    非线性自回归模型是一种典型的非线性动态神经网络,NARX主要由输出层、隐藏层和输出层构成。

    NARX模型是一个黑箱模型,即NARX内部具体的工作流程和运算过程无法清楚地解释,其中各节点的权重也没有明确的含义,但可以通过预测结果评价该模型的性能。

    3预测粮食产量模型的建立

    粮食产量预测模型的数据包含2个部分,即模型的输入时间序列数据(x1n~x7n)、输出时间序列数据(历年的粮食总产量y),输入延时量为2。本研究使用Matlab进行编程,建立NARX预测模型(图3)。

    由图3可知,训练数据占数据集的70%,验证数据占数据集的15%,测试数据占数据集的15%。训练模型时,训练数据、验证数据、测试数据是随机划分的,所以每次训练的结果都有所差异。训练结果见图4,NARX神经网络在训练4个周期后,在验证集上的误差上升,所以模型的训练可以结束,整个验证集的均方误差(MSE)為0.0055226。

    该模型在训练过程中梯度等参数变化见图5。粮食产量预测模型的效果可以通过分析误差图、误差自相关图、输入与误差相关图。在观测误差图中,黄色线表示误差线,即表示实际值与预测值之间的误差,误差越小表示模型的预测效果越好(图6)。误差自相关图(图8)中,误差在输入延迟(lag)为0时取得最大值,其他lag值处在置信区间为最佳。在输入与误差相关图(图9)中,输入与误差的相关系数越接近0越好,从图像上分析可知,NARX模型预测粮食产量的效果较好,预测准确度达到99.3%,符合预期效果。

    4模型的检验

    为了进一步验证模型的准确性和精度,用相同数据构建多元线性回归方程建立多元线性回归模型,根据数据拟合得到回归方程

    由图10可知,NARX粮食产量的预测模型的预测效果较好,与实际值相差不大,且没有出现过拟合和欠拟合的情况,而多元线性回归模型的预测数据与实际值相差较大,预测数据的波动也较大,所以NARX模型在粮食产量预测方面较多元线性回归模型的精度更高。由表5可知,当使用没有经过训练的数据进行预测时,NARX模型平均误差为1.5%,多元线性回归平均误差为10.88%,相比之下NARX模型的精度更高,预测得出的结果也更加接近真实值。

    5小结

    本研究从影响粮食产量的因素入手,选取7组与粮食产量相关的统计指标,并进行相关性分析,用统计学方法证明指标选取的合理性,接着引入时间序列非线性自回归神经网络构建粮食产量的预测模型。在模型检验部分通过与多元线性回归模型进行比较,证明该模型的精度优于多元线性回归模型,且该模型的平均误差仅为1.5%。总体来说,本研究构建的粮食产量预测模型可以应用在我国粮食生产的预测领域,为国家制定相关政策方针提供帮助。

    NARX模型的优势在于决定当前预测值时要考虑2个因素,一是输出时间序列的过去值,二是输入时间序列的当前值,这样可以使NARX的预测效果更佳。但是由于NARX神经网络中的延时阶数以及隐藏的神经元数,无法用科学的方法得出,只能依靠经验获取,即NARX模型依旧是黑盒模型,所以这些问题成为NARX模型发展的限制因素,这些因素在今后还有待进一步研究。

    本研究为我国粮食产量的预测提供了一种行之有效的方法,该方法不仅可以应用在粮食生产预测方面,在其他领域也有进一步研究的空间。

    参考文献:

    [1]赵和楠,侯石安.新中国70年粮食安全财政保障政策变迁与取向观察[J].改革,2019(11):15-24.

    [2]罗海平,邹楠,潘柳欣,等.生态足迹视域下中国粮食主产区粮食生产安全态势的时空属性研究:2007—2025[J].江苏农业学报,2019,35(6):1468-1475.

    [3]林彩云.云南省粮食主产区产量差异时间序列分析[J].中国农业资源与区划,2017,38(7):17-21.

    [4]侯云先.产量预报中滑动平均法的改进[J].河南农业大学学报,1994(3):417-422.

    [5]张煜.关于农业投入产出的线性回归模型[J].农村经济与科技,2019,30(18):227-228.

    [6]宗宸生,郑焕霞,王林山.改进粒子群优化BP神经网络粮食产量预测模型[J].计算机系统应用,2018,27(12):204-209.

    [7]程伟,张燕平,赵姝.支持向量机在粮食产量预测中的应用[J].安徽农业科学,2009,37(8):3347-3348.

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/2/11 2:47:32