网站首页  词典首页

请输入您要查询的论文:

 

标题 协同过滤算法在电影推荐系统中的应用
范文 黄莹 宋伟伟 邓春玲等
摘要:在大量电影中如何快速找到自身所喜爱的影片是一个很重要的问题,特别是在观众没有明确目标时,推荐系统则可发挥至关重要的作用。结合电影推荐系统的实际需求,通过阐述和分析协同过滤算法的特点和不足,提出了一种改进的协同过滤算法用于电影推荐中,改进了数据稀疏导致推荐系统正确性不高的问题,提高了系统的可靠性。
关键词:协同过滤;数据稀疏;电影推荐系统
DOIDOI:10.11907/rjdk.151400
中图分类号:TP312
文献标识码:A 文章编号文章编号:16727800(2015)008009202
0 引言
协同过滤算法是推荐系统的主要算法。本文简单介绍了协同过滤算法,表明数据稀疏是协同过滤算法的一个主要问题,解决数据稀疏问题可以提高协同过滤算法的可靠性及准确度。针对数据稀疏问题提出了自己的见解,将前人对协同过滤算法的改进用于电影推荐系统中,在一定程度上解决了由数据稀疏导致的推荐系统可靠性不高的问题。
1 协同过滤算法与数据稀疏问题
协同过滤(Collaborative Filtering)主要有3种推荐算法:基于用户(uersbased)的推荐算法和基于项目(itembased)的推荐算法[1]。协同过滤算法存在的主要问题有冷启动问题、数据稀疏问题、实时性问题、空间扩展问题。冷启动问题是数据稀疏问题的一个特例。本文采用基于用户的推荐算法。
基于用户的推荐算法是通过分析不同用户对物品的评分,通过模型计算用户之间的相似度,然后基于用户的相似度进行推荐。
首先输入用户资料,建立用户资料数据库。同时通过收集用户的历史行为和评分行为,将这些行为转换为用户对物品的评分,建立用户评分矩阵。
然后建立最近邻集,针对目标用户和数据库中的所有用户进行计算,找到相似度较高的用户建立最近邻集。计算用户之间相似度的常用方法有Person相关系数(见式1)、余弦相关性系数(见式2)和修正余弦相关性系数[2](见式3)。
最后得出推荐结果。根据建立的最近邻集,计算评测值(见式4),根据评测值大小进行推荐。
根据上述步骤可以看出,用户的评分决定用户相似度。所以,用户的评分数据稀疏会导致用户相似度误差很大,推荐系统的可靠性不高。解决数据稀疏问题是提高推荐系统可靠性的关键。
2 改进的协同过滤算法
数据稀疏是影响协同过滤算法的主要问题。解决数据稀疏问题的基本方法有简单填充法、基于聚类的方法、相似度传递法等。对稀疏矩阵进行填充是这些方法的核心思想。本文运用一种改进的协同过滤算法改善数据稀疏问题。改进算法的思想是改进填充数据稀疏矩阵的数值,提高协同过滤算法的可靠性。首先在最近邻集中计算目标用户与最邻近之间的相似度,每个最近邻用户都产生一个预测值[4],如式(5)所示:
Rai,y=Ra+sim(i,a)(Ri,y-Ri)0 Rai,y≠0Rai,y=0(5)
其中,Rai,y表示目标用户a的最近邻i对项目y的预测评分,Ri,y表示用户i对项目y的实际评分,Ra、Ri分别表示用户a和用户i的评分均值,sim(i,a)表示用户a和用户i的相似度。由此得到一个预测评分矩阵,在此基础上根据式(6)得到评分矩阵。
Pa,y=∑i∈Nsim(i,a)×Rai,y∑i∈Nsim(i,a)(6)
3 实验结果
现通过实验来验证改进策略的有效性。实验所用数据来自Movielens数据集,实验所得数据是改进策略的精度值,如图1所示。图1表明改进的协同过滤算法的精度值在0.8~1之间,比较稳定,误差不大。精度值的数值较高,说明该算法具有有效性。因此,实验结果表明,改进的协同过滤算法误差小、稳定性高,且具有有效性。
图1 改进的协同过滤算法的精度值
4 电影推荐系统模型
通过对现有电影推荐系统的观察和研究,结合上述改进算法,本文设计提出基于协同过滤的电影推荐系统模型,如图2所示。
5 结语
本文简单介绍了协同过滤算法,通过分析协同过滤算法及其存在的数据稀疏问题,设计提出了电影推荐系统模型,并在电影推荐系统中运用了一种改进策略,改善了数据稀疏性问题,提高了电影推荐系统的可靠性及准确度。但是改进算法的精度还存在一定误差,有待进一步提高。
参考文献:
[1] 许海玲,吴潇,李晓东,等.互联网推荐系统比较研究[J].软件学报,2009,20(2):350362.
[2] 王洋,骆力明.一种解决协同过滤数据稀疏性问题的方法[J].首都师范大学学报:自然科学版,2012,33(4):15.
[3] 查大元.个性化推荐系统的研究和实现[J].计算机应用与软件,2011,28(l):4749.
[4] 冯克鹏.基于协同过滤的数字图书馆推荐系统研究[J].软件导刊,2010,9(5):1618.
[5] 吴颜,沈洁,顾天竺,等.协同过滤推荐系统中数据稀疏问题的解决[J].计算机应用研究,2007,24(6):9497.
[6] 王国霞,刘贺平.个性化推荐系统综述[J].计算机工程与应用,2012,48(7):6676.
[7] 邓爱林,朱扬勇,施伯乐.基于项目评分预测的协同过滤算法推荐算法[J].软件学报,2003,14(9):16121628.
[8] CHRISTAKOU C,VRETTOS S,STAFYLOPATIS A.A hybrid movie recommender system based on neural networks[J].International Journal on Artificial Intelligence Tools,2007,16(5):771792.
[9] 孙小华.协同过滤系统的稀疏性与冷启动问题研究[D].杭州:浙江大学, 2005.
[10] SARWAR B,KARYPISG, KONSTAN J,et al. Itembased collaborative filtering recommendation algorithms[C].proc. of the 10th International World Wide Web Conference,2001:285295.
[11] 钱程,阳小兰.一种电影个性化推荐系统的研究与实现[J].计算机与数字工程,2011(8): 7376.
[12] 黄河铨,王群元.以社会网络与电影本体为架构之电影推荐系统[Z].2010.
[13] 蒋紫艳.基于 B/S 架构的零售业个性化推荐系统分析[J].现代商业,2008(36):180181.
[14] 曾春,邢春晓,周立柱.个性化推荐技术综述[J].软件学报,2002,13(10):19521961.
(责任编辑:黄 健)
随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2024/12/23 1:37:53