标题 | 基于改进BP神经网络算法的农产品电商精准营销研究 |
范文 | 黄成明 张荣臻 林新辉 摘要:本文针对农产品电商平台进行精准营销的过程中使用BP神经网络训练用户数据建立模型时,针对数据量巨大导致BP神经网络模型成型慢的问题,提出了一种基于改进BP神经网络算法的农产品个性化推荐模型。首先将用户数据进行汉明编码,并用汉明距离度量用户相似度,在此基础上将数据进行预分类。然后将此预分类结果集进行抽样,作为BP神经网络的输入,来提升建模速度。 关键词:精准营销;K近邻算法;BP神经网络;农产品电商 1引言 电商平台的精准营销解决方案,业界较为流行的是采用例如基于关联规则、K近邻、BP神经网络等算法,对用户进行相似性度量,从而将某些具有较高相似度的群体进行归类,从而实现精准营销。但由于农产品电商平台动辄几亿的用户数据,且农产品的消费行为具有严重的高噪声、非线性、多维特征等特点,导致在使用人工智能算法建立精准营销模型时速度过慢[1]。针对上述问题,本文提出了基于K近邻算法改进BP神经网络训练模型的过程,有效地提高了生成模型的速度,对具有海量数据的农产品电商平台实现精准营销具有重要的应用价值。 2BP神经网络农产品精准营销模型 2.1农产品精准营销原理 农产品的消费行为受多种因素的影响,如农产品的价格、供需关系、各地区的消费水平、甚至农产品的培养地区、培养方式、消费者个体偏好、季节因素、天气因素等。通过对大量数据的分析,定性分析出对农产品消费行为影响较大的特征主要有以下几个: 1)季节。农产品的生长具有较强的季节性,消费者对农产品的购买与月份具有强关联性。 2)消费水平。消费者消费能力的不同,对农产品需求的品类也不同。 3)消费者地域。由于大部分的农产品具有浓厚的地方特色,相同地域的消费者在购买农产品时有着很高的相似度。 4)消费者历史购买记录。消费者经常购买的品类,重复购买的概率较大。 对农产品进行精准营销,其本质上是对消费者的属性通过合理的特征提取构建一个特征数据集,通过对特征之间关系的计算,建立一个分类模型,通过对消费者进行群体划分从而实现精准营销。 2.2BP神经网络及其改进 BP(Back Propagation)神经网络是当前应用最广泛的人工神经网络[2],针对使用BP神经网络算法在农产品电商平台拥有海量用户数据的背景下进行精准营销时面临建模速度慢的问题,本文提出基于KNN算法改进BP神经网络的迭代过程,提升训练速度。基本步骤如下: 步骤1 数据预处理。对样本数据进行主成分分析提取特征,并对数据进行清洗,去除无效值。然后对特征进行汉明编码。最后将数据分为训练集和测试集。 步驟2 初始化KNN算法参数。K值选择奇数避免投票中出现类别数相同的状况,以交叉验证法确定最终K值[3]。 步骤3 计算样本数据的距离。本文采用汉明距离度量样本数据点之间的距离[4]。 步骤4 得到KNN分类的结果。最终分类结果为D=[D1,D2,D3,D4……],D表示结果数据集,D1,D2,D3,D4等分别表示对应某一类别标签的分类结果集。其中D1 = [X1,X2,X3,X4,X5……],其他数据项依次类推,X为样本数据,Y为该群体对应的分类标签。 步骤5 BP神经网络参数初始化。确定BP神经网络参数的初始值,如初始权重、初始学习率、阈值、隐含层节点数、神经网络层数、抽样系数等。 步骤6 将KNN分类结果D1,D2,D3,D4中的样本乘以抽样系数进行随机抽样,并分别作为BP神经网络的输入。 步骤7 计算输出层的实际输出,并计算与期望输出的误差,同时计算隐含层神经元梯度项,对权重值和阈值进行修正。 步骤8 生成BP神经网络模型。当损失函数达到预设值则迭代结束。否则转入步骤6继续进行下一轮学习。 基于KNN算法改进的BP神经网络算法结构如图1所示。 3实验结果与分析 本实验选取的样本数据包含消费者历史购买记录、季节、消费水平、消费者地域等四个特征。这些特征作为BP神经网络的输入,输出为生鲜类、时蔬类、肉类、瓜果等四个类别标签。本次实验为了验证本文提出方法的有效性,从训练速度和BP神经网络模型的准确率两个维度来进行对比实验。如图2所示为抽样系数和训练速度关系曲线可视化图形,当抽样系数取不同值时,训练速度也不同,训练速度随着抽样系数的增大而减小。 本文测试了不同抽样系数下生成的神经网络模型在测试数据集上的表现,观测到本文提出的方法在有效的加快了训练速度的同时,并未对模型的准确率产生影响,证实了本文方法的有效性。 4结束语 针对农产品电商精准营销领域面临的非线性、信息冗余度高、数据量大、采用BP神经网络训练数据时建模慢等问题,本文提出了一种基于KNN算法改进BP神经网络迭代过程的方法。本文通过实验验证了此方法在保证模型准确率的基础上有效的提升了BP神经网络的训练速度,在农产品的精准营销上具有重要的应用价值和经济效益。本方法虽然提升了农产品电商平台BP神经网络模型的训练速度,却增加了预分类的时间开销,故本方法在拥有海量数据的电商平台表现较好,可以大幅降低训练数据量,对于其他领域的普适能力,有待进一步研究。 参考文献 [1] 王赟松, 褚福磊, 何永勇,等. BP神经网络快速收敛算法研究[J]. 农业机械学报, 2004, 035(006):182-184. [2] 吴微, 陈维强, 刘波. 用BP神经网络预测股票市场涨跌[J]. 大连理工大学学报, 2001, 41(001):9-15. [3] 张宁, 贾自艳, 史忠植. 使用KNN算法的文本分类[J]. 计算机工程, 2005, 31(008):171-172. [4] 申金缓, 张文伟, 等. 利用汉明距离优神经网络学习样本[J]. 光学学报, 2000. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。