基于剔除孤立点的物流成本预测模型

邓必年



摘 要: 孤立点对物流成本预测结果具有干扰作用,而当前模型均没有考虑孤立点的负面影响,预测结果可信度低。为了改善物流成本的预测效果,提出基于剔除孤立点的物流成本预测模型。首先对当前物流成本预测研究现状进行分析,并根据密度方法找到物流成本原始数据中的孤立点,删除这些孤立点,然后对物流成本数据进行聚类,找到物流中隐藏的变化特点,采用最小二乘支持向量机建立物流成本预测模型,最后通过物流成本预测实验对性能进行测试。测试结果表明,该模型消除了孤立点的干扰,提高了物流成本的预测精度,物流成本预测的建模效率得到改善,具有很好的实际应用价值。
关键词: 物流成本; 孤立数据点; 密度方法; 预测模型
中图分类号: TN911.1?34; TP301 文献标识码: A 文章编号: 1004?373X(2017)13?0114?04
Abstract: The isolated point plays the interference effect on the forecast result of the logistics cost, but its negative effect isn′t considered in current model, and the reliability of the prediction result is low. In order to improve the forecasting effect of logistics cost, the logistics cost forecasting model based on isolated point elimination is put forward. The current research status of logistics cost prediction is analyzed. The isolated points in original data of the logistics cost are found out according to the density method, and removed. The data of logistics cost is clustered to seek out the change characteristics hidden in logistics. The least square support vector machine is used to establish the logistics cost prediction model. Its performance is tested by means of the logistics cost prediction experiment. The test results show that the model can eliminate the interference of isolated point, enhance the prediction accuracy of logistics cost, improve the modeling efficiency of logistics cost forecasting, and has perfect practical application value.
Keywords: logistics cost; isolated data point; density method; prediction model
0 引 言
随着经济、人们生活水平以及交通技术等不断改善,物流企业越来越多,导致企业之间的竞争加剧,物流成本预测直接影响物流企业的经济效益,是物流研究领域中的一个重要方向,引起了人们的高度关注[1]。
物流成本与一个地区的经济、政策以及交通状况密切相关,是一个复杂多变系统,最原始的物流成本预测通过手工方式实现,一些专业人员采用统计学理论对物流成本进行分析和预测,该方式对小规模物流成本预测可以实现,对于现代大规模物流成本计算过程太复杂,工作效率低,而且易出错。随后有学者提出了物流成本自动预测模型。有学者采用时间序列法对物流成本进行建模,根据收集的物流历史成本数据发现原物流成本将来的变化特点,相对于手工方式,提高了物流成本的预测效率,预测结果更加可靠、稳定,但它们属于线性预测模型,而物流成本不是简单的线性变化,同时具有随机性、波动特性,故无法描述物流成本的非线性变化特点,导致有时预测结果与实际值相差大,物流成本的预测精度低[2]。为了克服线性预测模型的不足,有学者提出了非线性的物流成本预测模型,可以描述物流成本的非线性变化特点,提高了物流成本预测精度[3?4],主要有神经网络、支持向量机等非物流成本预测模型,但它们缺陷也十分明显,如支持向量机的物流成本建模时间长,神经网络要求历史样本多等[5]。最小二乘支持向量机(LSSVM)减少了物流成本的建模时间,需要的物流历史样本少,因此成为物流成本预测的主要建模工具[6?7]。相关研究表明,在物流成本预测模型的建立过程中,一些孤立点对预测结果影响大,对LSSVM的学习过程产生干扰,因此,如何有效剔除物流成本数据中的孤立点,改善物流成本的预测效果十分关键[8]。
为了消除孤立点对物流成本预测结果的干扰作用,提出基于剔除孤立點的物流成本预测模型。首先采用密度方法删除物流成本原始数据中的孤立点,然后对物流成本数据进行聚类分析,采用最小二乘支持向量机建立物流成本预测模型,物流成本预测实验结果表明,该模型提高了物流成本的预测精度,改善了物流成本预测的建模效率。
1 剔除物流成本历史数据中的孤立点
在物流成本的历史数据中,由于工作人员、收集条件等限制,会有一定数量的孤立点,这些孤立点实际是一些无用的数据,会对物流成本建模过程产生干扰,因此在建立物流成本预测模型之前,准确剔除这些孤立点有助于后续的物流成本预测,因此本文采用密度方法对物流成本的历史数据进行分析,找到其中的孤立点。
设为第个物流成本的历史样本数据点,为邻域内的物流成本数目,为预先设置的最少数据量,其计算公式为:
剔除物流成本历史数据中孤立点的步骤为:
Step1:收集一个物流成本历史数据并设置的值。
Step2:估计样本点的领域大小Eps。
Step3: 估计任意样本点与其他物流成本数据点之间的距离,并估计物流成本样本数据点的值。
Step4: 根据式(3)对物流成本历史数据进行分析,找到其中的孤立点。
Step5:从物流成本历史样本中删除孤立点,剩下的物流成本历史数据组成学习样本。
2 物流成本预测模型的构建
2.1 物流成本数据的聚类分析
物流成本数据具有固定变化规律,可以对剔除物流成本历史数据进行聚类分析,选择与预测点具有相似变化特点的数据,减少训练数据样本的规模,加快物流成本数据建模速度。设物流成本数据集为为物流成本样本点数,共有类,且有则聚类分析的目标函数定义为:
2.2 最小二乘支持向量机
设物流成本建模训练样本为最小二乘支持向量机引入映射函数对其进行空间变换,做如下的回归过程:
式中:和为最小二乘支持向量机的参数。
为了找到最佳二乘支持向量机参数和的值,引入松弛因子,找到与式(7)等同的多约束函数,即有:
2.3 物流成本预测模型的建立步骤
Step1:对一个具体物流成本预测问题收集相应的历史样本。
Step2:采用密度方法剔除物流成本原始数据中的孤立点。
Step3:对物流成本数据做如下处理,减少数据的变化幅度。
Step4:对剔除孤立点的物流成本数据进行聚类,找到预测点的最优训练样本数据集。
Step5:将最优训练样本数据集输入最小二乘支持向量机,建立物流成本预测模型。
Step6:采用具体物流成本数据对物流成本预测模型性能进行分析,并对物流成本将来的值进行估计。
综上可知,基于剔除孤立点的物流成本预测模型工作流程如图1所示。
3 实验结果与分析
为了测试基于剔除孤立点的物流成本预测模型的性能,采用VC++编写物流成本预测程序,收集到物流成本历史样本,密度方法剔除其中的孤立点,最后得到200个数据,如图2所示。
采用聚类分析选择物流成本预测的训练样本,建立物流成本预测模型,物流成本的单步预测结果如图3所示。从图3可知,物流成本预测值与实际值之间误差很小,这说明本文模型可以发现物流成本样本点数据中隐藏的变化特点,是一种精度高的物流成本预测模型。
提前三步的物流成本预测结果如图4所示。对图4进行分析可以清楚看出,物流成本的多步预测精度要低于物流成本的单步预测精度,预测误差增加,但还是可以从整体上描述物流成本的变化特点,预测结果有一定的实际价值,可以帮助有关部门制定相应的管理措施。
为了分析本文模型的优越性,选择文献[9?10]的物流成本预测模型进行对比实验,采用预测精度(%)作为评价标准,结果如表1所示。从表1可以发现,本文模型的物流成本预测精度要高于其他模型,更好地反映了物流成本预测变化特点,降低了物流成本预测误差,具有明显的优越性。
在物流成本建模过程中,训练时间影响预测效率,统计不同模型的物流成本建模时间,具体如图5所示,对图5的物流成本建模时间进行对比分析,可以看出,本文模型的物流成本建模时间最少,优势十分明显,可以满足速度要求快的物流成本预测领域。
4 结 语
在物流成本建模过程中,预测结果的好坏与样本选择直接相关,为了避免孤立点对物流成本预测结果的负面影响,设计了基于剔除孤立点的物流成本预测模型,测试结果表明,无论是单步或者多步的物流成本预测结果,本文模型的性能都得到了不同程度的改善,物流成本预测误差大幅度下降,同时由于剔除孤立点,通过聚类分析选择与预测点相关的样本,减少了训练样本的规模,物流成本建模速度加快,具有更广的应用范围。
参考文献
[1] YUEN S Y, CHI K C. A genetic algorithm that adaptively mutates and never revisits [J]. IEEE transactions on evolutionary computation, 2009, 13(2): 454?458.
[2] 陈森,周峰.基于灰色系统理论的物流需求预测模型[J].统计与决策,2006(3):59?60.
[3] 王晓原,李军.灰色GM(1,1)模型在区域物流规模预测中的应用[J].武汉理工大学学报,2011,9(3):613?615.
[4] 尹艳玲.基于自适应神经网络的物流需求预测研究[J].河南理工大学学报(自然科学版),2010,29(5):700?704.
[5] 后锐,张毕西.基于MLP神经网络的区域物流需求预测方法及其应用[J].系统工程理论与实践,2005(12):43?47.
[6] 陈以,万梅芳.BPNN神经网络在物流系统中的应用[J].计算机仿真,2010,27(4):159?163.
[7] 胡燕祝,吕宏义.基于支持向量回归机的物流需求预测模型研究[J].物流技术,2008,27(5):66?68.
[8] 闫莉,薛惠峰,陈青.基于灰色马尔可夫模型的区域物流规模预测[J].西安工业大学学报,2009,29(5):495?497.
[9] 初良勇,田质广,谢新连.组合预测模型在物流需求预测中的应用[J].大连海事大学学报,2004,30(4):43?46.
[10] 陈建军.蚁群算法在物流配送路径优化中的研究[J].计算机仿真,2011,28(2):268?271.
[11] 王鐵君,邬月春.基于混沌粒子群算法的物流配送路径优化[J].计算机工程与应用,2011,47(29):218?221.
[12] TSENG L Y, LIN Y T. A hybrid genetic local search algorithm for the permutation flowshop scheduling problem [J]. European journal of operational research, 2009, 198(1): 84?92.
[13] 孙建丰,向小东.基于灰色线性回归组合模型的物流需求预测研究[J].工业技术经济,2006,26(10):146?148. 技术文