基于支持向量机的生鲜农产品风险损失预估
毛媛媛 张东 华小草 胡海洋 徐壮壮
【摘? ?要】 生鲜农产品的损失预测对我国的农业生产和应急处理具有重要的意义,本论文在考虑自然灾害风险如:多旱、涝、风、雹、霜冻等农业气象灾害的条件下,构建了基于网格搜索的支持向量机(Support vector machine,SVM )生鲜农产品损失预测模型。对多项指标进行预测。选取1999年-2015年的河南受灾数据作为研究样本,结果验证了基于网格搜索的支持向量机损失预测模型在生鲜农产品损失預估上的合理性和有效性。
【关键词】 支持向量机;网格搜索;生鲜农产品;损失;预估模型
中图分类号:S-9? ? ? ? ? ? ? ?文献识别码:A? ? ? ? ? ? ? ?文章编号:2096-1073(2020)01-0047-50
1? 引言
我国是自然灾害多发的国家,据统计,2017年各种自然灾害共造成我国14448.0万人次受灾,直接经济损失3018.7亿元。多旱、涝、风、雹、霜冻等农业气象灾害对生鲜农产品的生产造成了极大的影响。因此对生鲜农产品的生产风险进行分析和评估对维持我国生产及社会稳定有着重大的意义。H.S.Kim[1]等将SVM模型应用于中小企业的违约情况预测,支持向量机模型的回归模型更优。Ahmed K.Abbas[2]等运用支持向量机方法构建模型应用于预测井漏事故,支持向量机方法的应用前景更加广阔。Zhitong Ma[3]等提出了SVM预测我国建筑能耗的方法。Yahia等[4]用神经网络的方法构建了冷链物流需求预测模型。徐歆,严洪森等[5]采用了支持向量机和径向基函数核支持向量机建立了产品销售预测模型。Hou和Gao[6]采用了网格搜索(GS)算法优化SVM参数精度更高。张文雅等[7]将网格搜索优化支持向量机的方法应用于适合汽车销售预测。缪芸,缪翼军等[8]将SVM应用于变压器风险评估模型。汪海燕,黎建辉,杨风雷等[9]肯定了SVM在应用领域的优势。王健峰,张磊等[10]在分析多种算法SVM参数优化方面的利弊,提出了新的网格法。
从以上文献分析可知,支持向量机在理论和性能上优势明显[11]它找到的最优解并非局部最小值而是全局最优值,在多个领域均有其应用成果[12-15]采用网格搜索法进行参数寻优可以得到更为全面准确的参数值[16-17]。以往的学者们鲜少将网格搜索优化支持向量机的方法应用于生鲜农产品损失评估中。因此,本论文在考虑自然灾害风险的条件下,研究生鲜农产品在自然灾害风险下的产量损失问题[18]。
2? 基于支持向量机的生鲜农产品损失模型
SVM是由V.N.Vapnik和A.Y. Lerner在1963年提出的一种机器学习方法[19]。随着模式识别等技术的不断发展,SVM模型得到了优化和完善,目前被逐步应用于各种灾情的风险预测上。
2.1? 支持向量机模型
为分析问题方便,对模型做出以下假设;
通常SVM用来解决分类问题对于一般线性回归问题:
对于线性不可分回归问题:
引入核函数:
本研究采用的是径向基核函数(Radial Basis Function简称RBF)。
2.2? 实例分析
实例见表1。
本研究采用的数据来源于国家统计局以及中国统计年鉴。选取的样本数据为1999-2015河南省生鲜蔬菜的产量,单位面积产量,受灾面积,成灾面积等各项指标。
在python语言中,选用径向核函数分别对蔬菜产量,蔬菜单位面积产量,蔬菜受灾面积,蔬菜成灾面积做出预测,如图1-4。对四种属性预测的结果误差值如表2。
由图1可知,本论文所构建模型对蔬菜产量预估曲线与实际样本曲线趋势基本一致,但1999年,2000年,2001年以及2003年的样本实际值均小于预测值,2014年及2015年的实际值大于预测值。由图2可知,对于单位面积产量而言,2000年的样本实际值大于预测值。由图3可知,对于受灾面积而言,2002年,2009年的样本实际值大于预测值,但2008年,2015年的样本实际值小于预测值。由图4可知,对于成灾面积而言,2002年,2005年的样本实际值大于预测值,但2015年的样本实际值小于预测值。
四种样本属性中对蔬菜产量预测精度最高的原因可能是:①本研究只选取了四种属性,这四种属性与蔬菜的产量相关性更强。②未选取经济属性,社会属性,人文属性等分析其对生鲜农产品生产风险损失的影响。③自然灾害在时间维度中具有高度的不确定性和不规律性。
3? 总结
本研究考虑自然灾害风险如:多风、雹、旱、涝、霜冻等农业气象灾害的条件下,构建了基于网格搜索的SVM生鲜农产品损失预测模型。并以河南省为例,研究的结果表明,选用径向核函数的SVM预测模型适合生鲜农产品损失预测,其中对于产量的预测更为准确。并且当灾情较轻时,此模型可以对受灾面积以及成灾面积做出较好的预测。在后期研究中应多考虑经济属性以及社会属性以及人文属性的影响从而提高模型的精度和预测的准确性。
参考文献:
[1] H.S.Kim , S.Y.Sohn. Support vector machines for default predic-tion of SMEs based on technology.credit[J].European Journal of?Operational Research, 2010,201(3):838-846.
[2] A. K. Abbas, N. A. Al-haideri,A. A. Bashikh. Implementing arti-ficial neural networks and support vector machines to predict lostcirculation[J].Egyptian Journal of Petroleum,2019.
[3] Z.Ma, C.Ye, H.Li ,W.Ma, Applying support vector machines to predict building energy consumption in China[J]. Energy Proce-dia,2018 ,152:780-786.
[4] E.M .Yahia, Cold chain development and challenges in the de-veloping world[J]. Acta Horticulturae ,2010,(877):127-132.
[5] 王寧, 谢敏,邓佳梁,等.基于支持向量机回归组合模型的中长期降温负荷预测[J].电力系统保护与控制,2016,44(3):92-97.
[6] Gao X, Hou J. An improved SVM integrated GS-PCA fault diag-nosis approach of Tennessee Eastman? ?process[J]. Neurocom- puting, 2016, 174: 906-911.
[7] 张文雅,范雨强,韩 华,等.基于交叉验证网格寻优支持向量机的产品销售预测[J].计算机系统应用,2019,28(5):1-9.
[8] 缪芸,缪翼军,陈红坤,等.基于模糊层次分析法与支持向量机的变压器风险评估[J].现代 电力,2014,31(6):64-69.
[9] 汪海燕,黎建辉,杨风雷.支持向量机理论及算法研究综述[J].计算机应用研究,2014,31(5):1281-1286.
[10] 王健峰,张 磊,陈国兴,等.基于改进的网格搜索法的SVM参数优化[J].应用科技,2012,3:28-31.
[11] 张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42.
[12] G.Najafi, B.Ghobadian, A.Moosavian .SVM and ANFIS for pre-diction of performance and exhaust emissions of a SI engine with gasoline-ethanol blended fuels[J]. Applied Thermal Engi-neering, 2016, 95: 186-203.
[13] 辜丽琼,宋祖康,杨阳.基于改进支持向量机模型的交通拥堵情况预测[J].软件导刊,2019,(7):37-41.
[14] 李飞,蒋敏兰.基于支持向量机回归的蛋鸡产蛋率预测模型[J].江苏农业科学,2019,47(13):249-252.
[15] 李晓东,席升阳,潘立.基于最小二乘支持向量机的中国粮食产量预测模型研究[D].洛阳:河南科技大学,2007.
[16] 付元元,任东.支持向量机中核函数及其参数选择研究[J].科技创新导报,2010,(9):6-7.
[17] 王健峰,张磊,陈国兴,等.基于改进的网格搜索法的SVM参数优化[J].2012,39(3):28-31.
[18] 孙德山.支持向量机分类与回归方法研究[D].大连:辽宁师范大学,2004.
[19] Sain, Stephan R . The Nature of Statistical Learning Theory[J]. Technometrics, 1996, 38(4):409-409.
[20] 王平,黄河,吴玮.基于支持向量机的湖北省洪涝农业 损失预测模型[J].湖北农业科学,2014,53(18):4437-4440.
(编辑:赫亮)