标题 | 基于协同过滤的影视营销推荐算法研究 |
范文 | 阳甫军 李博 摘?要:随着三网融合的不断发展,传统广电媒体更需要建立一套完善的影视营销推荐系统,将海量的影视资源精准有效的推荐给每一位用户。在推荐系统中,协同过滤算法是应用较为广泛的一种推荐方法。讨论了传统协同过滤算法在影视营销中的应用,提出一种加权混合推荐算法,并将算法应用在影视营销推荐场景中,推荐算法的精准度得到了一定提升。 关键词:协同过滤;推荐算法;皮尔逊相似度 中图分类号:F27?????文献标识码:A??????doi:10.19311/j.cnki.1672-3198.2019.17.024 随着互联网技术的不断发展,三网融合为传统广播电视媒介带来了新的发展机遇。影视行业也受到大众的关注和喜爱,海量的影视资源爆炸性增长。传统广电媒体更需要建立合理的推荐系统,将海量的影视资源精准的推荐给用户,用户也能在平台上快速找到自己喜欢的电影,提高用户对广电媒体平台的依懒性,最终使得个性化的影视产品营销服务成为现实。 本文的主要工作是建立用户影视评价体系、得到用户与影视产品的评价矩阵,结合协同过滤的个性化推荐思想,综合考虑推荐系统中的矩阵稀疏性问题、冷启动问题,对协同过滤算法进行改进,设计出一种混合推荐算法,并运用到实际推荐系统中,提高个性化影视资源推荐的精准度。 1?数据分析 本文的影视产品数据包含561288条用户收视信息数据,这些数据来自1329位用户和41876部影视。本文对这些数据进行数据清洗、数据规约之后,得到了部分用户收视信息情况如图1。 2?构建用户影视评价体系 本系统采用隐式评分的方式构建评价体系,即根据用户的收视行为数据进行模型构建,具体模型如下: 其中,Spij表示用户i第p次观看影视产品j的时长,λ表示用户i观看影视产品j的总次数。Tj表示影视产品j的总时长。ξij表示最终评分,式(3)表示将得到的ξij进行标准化处理。 同时,将隐式评分的等级分为5个等级,具体如表1所示。 根据上述的隐式评价模型,我们可以得到一个关于用户与影视作品的评价矩阵,其散点图如图2所示。 3?协同过滤算法设计 协同过滤算法又称社会过滤,其在不同的场景具有不同的运用,故算法种类较多。而在实践中较为广泛利用的协同过滤推荐算法主要有两种,下文将具体分析。 3.1?基于内存的协同过滤算法 基于内存的协同过滤算法第一步是计算用户之间的相似度,相似度可以衡量两个用户对影视作品之间的兴趣程度。常用的相似性度量标准有余弦相似度、改进余弦相似度、皮尔逊相似度。其中ξi表示用户对所有影视作品j的评分均值,ξi,j表示用户i对影视作品j的评分值, Sik=Si∩Sk表示用户i和用户k都评价过的电影集合。其公式分别如下: 然后,将最大目标用户相似度的用户作为最邻近用户集合,邻居用户对目标影视作品未评分的进行预测评分。采用中心加权平均方法来计算目标用户i对影视作品j的預测评分,评分r^i,j可表示为: 最后,根据评分高低得到推荐结果,基于内存的协同过滤算法流程图如图3。 3.2?基于模型的协同过滤算法 基于模型的协同过滤算法在实践中运用广泛,它可以通过矩阵分解、关联算法、神经网络、聚类算法等方法来进行实现。本文综合考虑用户与影视作品数据的稀疏性、算法的计算效率、影视作品冷启动等问题,采用矩阵分解方法(SVD)完成协同过滤算法。 因此,需要将误差平方和SSE降到最小即可。在本文推荐系统中,为了P和Q中所有值都全部更新,故选取常用的梯度下降法对其进行训练。 3.3?混合推荐算法 上述两种推荐算法都各自具有优缺点,但在实际过程中,不同的推荐算法往往适用于不同的场景,采用混合推荐算法更加精准。为了发挥不同推荐算法的优缺点,本文将上述两种算法组合,对其推荐结果进行线性加权平均得到最终推荐结果,公式如下: 4?结果对比 4.1?评价标准 均方根误差是衡量结果精准度的常用评价标准之一,其通过计算实际值与预测评值之间的误差来判断推荐结果的精准度。在本文场景中,RMSE (均方根误差)公式见式(13)。均方根误差越小,推荐系统的精准度越高。 4.2?评价分析 本文随机采取5组评分数据对以上3种方法推荐结果精准度检验,将方法一记作UB- CF,方法二记作SVD,混合推荐算法记作P-CF。三种推荐算法最终实验结果如图4。 由图可以看出,随着测试次数的增加,混合推荐算法精准度更高。 5?结论 本文首先构建了用户隐式评分模型,对于基于内存、模型两种协同过滤算法进行了讨论。针对这两种算法的不足,提出了一种加权混合推荐算法,通过最后结果分析,混合推荐算法提高了算法的精准度和可适应性,更能满足广电媒体的个性化推荐影视作品的要求。 参考文献 [1]刘青文.基于协同过滤的推荐算法研究[D].北京:中国科学技术大学,2013. [2]尹航,常桂然,王兴伟.采用聚类算法优化的K近邻协同过滤算法[J].小型微型计算机系统,2013,34(4):806-809. [3]顾军华,官磊,张建.基于Hadoop的IPTV隐式评分模型[J].计算机应用,2017,(11):156-161. [4]刘文佳,张骏.改进的协同过滤算法在电影推荐系统中的应用[J].现代商贸工业,2018,39(17):63-66. [5]杨文娟,金子馨.基于聚类的协同过滤算法的研究[J].电脑知识与技术,2018,14(16):190-193. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。