标题 | 改进遗传算法在实体商业中精准营销研究与实现 |
范文 | 邹倩颖 王小芳 摘 要: 由于实体商业市场缺乏像电商平台那样的个性化交互平台,因此无法对客户进行精准营销,使得在商业市场上的竞争力越来越弱。为了解决这一问题,引入商家基因库模型,并记录客户在实体店铺中的历史购物行为、关注的产品类别等,结合最佳邻居、效用函数等提出赋有权重的客户偏好模型。利用改进遗传算法对商家基因库模型与客户偏好模型进行匹配,以实现精准营销。研究以大数据为背景,利用Hadoop集群的MapReduce编程实现改进遗传算法,用以在n维商家空间中快速、精准地找出最符合客户需求的商家。实验结果表明,改进遗传算法相对于传统遗传算法在推荐准确率上平均提升15.6%,在推荐响应时间上提升41.9%。 关键词: 改进遗传算法; 精准营销; 商家基因库; 客户偏好模型; 范围相似度函数; 大数据 中图分类号: TN911.1?34; TP312 文献标识码: A 文章编号: 1004?373X(2018)13?0177?05 Abstract: The entity commerce lacks of personalized interactive platform as the e?commerce, and can′t perform the precision marketing for client, so the competitiveness becomes weaker in commercial markets. For the above problem, the merchant gene library model is introduced, the historical shopping behavior and concerned product category of entity stores are recorded for clients, and the best neighbor and utility function are combined to propose the client preference model with weighting. The improved genetic algorithm is used to match the merchant gene library model with client preference model to realize the precision marketing. On the basis of big data, the MapReduce programming of Hadoop cluster is adopted to improve the genetic algorithm, which can quickly and accurately find out the merchant mostly meeting the requirements of client in n?dimensional merchant space. The experimental results show that the recommended accuracy of the improved genetic algorithm is 15.6% higher than that of the traditional genetic algorithm, and the recommended response time is improved by 41.9%. Keywords: improved genetic algorithm; precision marketing; businesses gene library; client preference model; function of range similarity; big data0 引 言 隨着“互联网+”的浪潮席卷而来,传统实体商业(如百货商场)却在此次浪潮中受到非常大的冲击。根据iziRetail抽样调查数据显示,2016年上半年全国近六成的百货商场业绩处于下滑状态,很多商场甚至濒临倒闭或者已经倒闭的状况。因此,对于目前的大型实体商业而言,积极探寻新的经营理念,利用先进大数据技术,在新时代、新环境下实现商业模式转型,是目前所有实体商业领导者亟待解决的问题。 研究以某大型实体商业为背景,首先对商场中所有商家所售产品建立商家基因库模型[1];然后根据客户在此商场中的消费记录、当前关注的产品类别等信息,使用聚类算法构建带权重的客户偏好模型;最后利用改进的遗传算法实现在商家基因库及海量客户群之间快速、精准的匹配,获得匹配度从高到低的推荐列表,并利用新媒体方式为每一位客户实现个性化推荐,以达到精准营销的目的。研究所有模型均建立在大数据分布式处理Hadoop 2.0平台上,此平台本身保证了模型的可用性、高效性及扩展性。 以餐饮业为例,传统遗传算法匹配度在70%~75%范围内的数据有1 140 528条,高于改进遗传算法,其在75%~100%范围内的数据则低于改进遗传算法,推荐率在传统遗传算法基础上平均提高15.6%。改进遗传算法优于传统遗传算法的原因有以下两点: 1) 在传统遗传算法之前加入k?means算法对数据进行初始聚类,将商家基因累积,抬高特征值,加快遗传算法对特征基因的识别和匹配分析。 2) 在使用传统遗传算法之后加入范围相似度函数求被推荐用户的亲密好友f,对遗传算法得出的相似最优解集做出最优选择,使最优解的范围更精确。4 结 语 本文提出一种改进遗传算法,即首先在传统算法之前加入k?means算法,使数据源特征更具有集中性,再应用遗传算法得出相似最优解集,最后使用自定义范围相似度函数求解推荐率。以上所有算法均采用Hadoop集群MapReduce编程模型并行实现。 本文提出的算法仍有需要改进的地方,以下几个方面需要基于实际情况不断完善。 1) 利用k?means算法对用户和商家数据进行初始聚类,其中对[k]值的确定有待完善,当用户和商家的数据有变动时,所确定的[k]值就需要更新。 2) 对新用户的数据采集方式可以更具个性化,提高新用户数据参数的精确度以及快速有效地采集并存储其数据,进行精准计算。 3) 在计算最终推荐率时,将相似最优解放入[n]维空间中,以其为圆心,人为设定阈值为85%,在此范围的即为最优解的“亲密好友”[f]。因此,在寻找最优解的亲密好友时可以设定一个算法自动确定以最优的相似程度范围取值。参考文献 [1] 张浩.基于商品基因和遗传算法的个性化推荐系统[J].計算机系统应用,2011,20(12):114?117. ZHANG Hao. Personalized recommendation system based on commodity gene and GA [J]. Computer system & applications, 2011, 20(12): 114?117. [2] 朱会霞,郝志云,王福林.二进制遗传算法编码长度的计算方法[J].辽宁工业大学学报(自然科学版),2016,36(2):138?140. ZHU Huixia, HAO Zhiyun, WANG Fuling. Calculation method of encoding length for binary encoded genetic algorithm [J]. Journal of Liaoning University of Technology (natural science edition), 2016, 36(2): 138?140. [3] 吴夙慧,成颖,郑彦宁,等.K_means算法研究综述[J].现代图书情报技术,2011(5):28?35. WU Suhui, CHENG Ying, ZHENG Yanning, et al. Survey on K?means algorithm [J]. Data analysis and knowledge discovery, 2011(5): 28?35. [4] 刘英.遗传算法中适应度函数的研究[J].兰州工业高等专科学校学报,2006(3):1?4. LIU Ying. Research on fitness function in genetic algorithm [J]. Journal of Lanzhou Polytechnic College, 2006(3): 1?4. [5] 卢向华.竞价排名广告的关键词投放策略及其绩效研究:基于淘宝网的实证分析[J].管理科学学报,2013,16(6):1?9. LU Xianghua. Empirical study of keywords biding strategy and search engine advertising performance [J]. Journal of managements sciences in China, 2013, 16(6): 1?9. [6] 刘铁男,姜建国,陈继刚,等.遗传算法的收敛性分析[J].大庆石油学院学报,2000(3):40?42. LIU Tienan, JIANG Jianguo, CHEN Jigang, et al. Convergence analysis of genetic algorithms [J]. Jounal of Daqing Petrolmum Institute, 2000(3): 40?42. [7] 汪民乐.遗传算法的收敛性研究[J].计算技术与自动化,2015,34(1):58?62. WANG Minle. Research on convergence of genetic algorithm [J]. Computing technology and automation, 2015, 34(1): 58?62. [8] 张栋冰.一种基于遗传算法的特征选择和权重确定方法[J].怀化学院学报,2015,34(5):59?62. ZHANG Dongbing. A feature selection and weights determination method based on genetic algorithm [J]. Journal of Huaihua University, 2015, 34(5): 59?62. [9] 邓波,张玉超,金松昌,等.基于MapReduce并行架构的大数据社会网络社团挖掘方法[J].计算机研究与发展,2013,50(z2):187?195. DENG Bo, ZHANG Yuchao, JIN Songchang, et al. Community detection in big social networks based on MapReduce framework [J]. Journal of computer research and development, 2013, 50(S2): 187?195. [10] 刘星毅,韦小铃.基于欧式距离的最近邻改进算法[J].广西科学院学报,2010,26(4):409?411. LIU Xingyi, WEI Xiaoling. Improved kNN algorithm based on Euclidean distance [J]. Journal of Guangxi Academy of Sciences, 2010, 26(4): 409?411. [11] 罗军,朱文奇.考虑物品相似权重的用户相似度计算方法[J].计算机工程与应用,2015,51(8):123?127. LUO Jun, ZHU Wenqi. User similarity function considering weight of items similarity [J]. Computer engineering and application, 2015, 51(8): 123?127. [12] 谌超,强保华,石龙.基于Hadoop MapReduce的大规模数据索引构建与集群性能分析[J].桂林电子科技大学学报,2012,32(4):307?312. CHEN Chao, QIANG Baohua, SHI Long. Large scale data index construction and cluster efficiency analysis based on Hadoop MapReduce [J]. Journal of Guilin University of Electronic Technology, 2012, 32(4): 307?312. [13] 王悦.遗传算法在函数优化中的应用研究[J].电子设计工程,2016,24(10):74?76. WANG Yue. Application of genetic algorithm in function optimi?zation [J]. Electronic desigen endineering, 2016, 24(10): 74?76. [14] 李建江,崔健,王聃,等.MapReduce并行编程模型研究综述[J].电子学报,2011(11):2635?2642. LI Jianjiang, CUI Jian, WANG Dan, et al. Survey of MapReduce parallel programming model [J]. Acta electronica sinica, 2011(11): 2635?2642. [15] Wiki. Institutions and companies using Hadoop [EB/OL]. (2010?12?25). [2010?12?28]. http://wiki.apache.org/hadoop/PoweredBy. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。