网站首页  词典首页

请输入您要查询的论文:

 

标题 区分长短期兴趣的用户动态推荐模型研究
范文

    朱妮

    

    

    

    [提要] 本文基于隐形反馈数据集提出区分用户长期兴趣和短期兴趣的推荐模型DYLSI,该模型主要考虑到用户兴趣、项目流行度随时间的变化以及长短期兴趣的不同,针对数据稀疏、用户兴趣刻画不细致等问题提出解决方案。实验结果表明:与传统的遗忘曲线、时间窗口和基于矩阵分解的协同过滤相比,本模型在F1-Score评价指标上展现出更加优越的性能。同时,本文计算用户兴趣偏好時,提取长短期兴趣集合、用户活跃度、项目流行度相关指标,可为用户自动打标签,为后续研究用户兴趣的动态演化过程或者网站功能扩展提供更多选择。

    关键词:兴趣漂移;动态推荐;长短期兴趣;隐式反馈

    中图分类号:F724.6 文献标识码:A

    收录日期:2020年3月10日

    一、引言

    在互联网时代,用户和项目数量均以指数级迅速增长,带来海量信息的同时也引发了信息过载。Media Research(艾媒咨询)数据显示,截至2019年,中国移动电商用户规模将突破7亿人。各大电商平台正在寻求一种个性化推荐的服务模式,对不同的用户提供不同的服务策略和服务内容,其中,用户兴趣建模的准确性是个性化推荐系统的关键。

    在目前用户兴趣建模的研究成果梳理中发现,针对用户兴趣迁移问题,经典的解决方法为时间窗口和遗忘曲线,而这些算法往往将用户兴趣衰减同等对待,没有考虑到用户兴趣类型的不同。通常长期兴趣较稳定,而短期兴趣不稳定,但具有很高的实时性。另外,推荐领域的绝大多数文献都侧重于处理显式评分数据,然而在许多实际情况下,特别是在电商商务推荐系统需要以隐式反馈为中心。针对以上问题,本文基于隐性反馈数据集提出了区分用户长期兴趣和短期兴趣的用户动态推荐模型DYLSI,通过对用户兴趣进行追踪和建模,提取出用户的长短期兴趣模式,捕捉用户兴趣漂移,并得到用户兴趣分布,进一步丰富用户画像。

    二、文献综述

    (一)国外研究现状。在基于长短期兴趣混合的动态兴趣模型中,Shtykh和Jin采用多层次的动态文件结构来反映用户兴趣的波动性,其中包含表示长期兴趣的层次和短期兴趣的层次,并强调了长期兴趣的稳定性。Lee等人提出一种新的正态分布密度曲线遗忘函数,并将用户模型定义为长短期兴趣相结合的混合兴趣模型,短期模型使用滑动窗口算法进行更新,长期模型采用正态渐进遗忘算法进行更新。Li等人在新闻个性化推荐中结合了长期兴趣和短期兴趣,首先根据用户长期兴趣的配置文件来区分用户可能喜欢的新闻组,然后在每个长期兴趣对应的推荐列表中根据短期兴趣进行推荐。Bennett将用户兴趣划分为长期兴趣、短期兴趣和除去短期兴趣的长期兴趣,实验结果表明结合这三种兴趣模式的检索准确率最高。

    (二)国内研究现状。在基于长短兴趣融合的动态兴趣模型中,冯永等人提出一种携带历史元素的循环神经网络推荐模型负责用户短期动态兴趣建模,基于前馈神经网络推荐模型对用户长期兴趣建模。黄敦贤将用户兴趣分为长期兴趣、短期兴趣和偶然兴趣,分析三类兴趣对用户未来兴趣预测的影响,构建用户动态兴趣模型。在吕学强等人的研究中,将用户兴趣分为短期兴趣集合和长期兴趣集合,通过滑动时间窗口来控制和判断。在伍大清等人的研究中,将用户兴趣分为长期兴趣和短期兴趣,对短期兴趣采用滑动窗口处理更新,对长期兴趣采用最少使用淘汰算法。在王晓春等人的研究中,设计一种长短兴趣结合的通用方法,将短期历史近似定义为与测试查询时间距离最近的n次的记录,并根据不同n的取值计算短期兴趣。

    三、用户长短期兴趣识别算法

    现有的协同过滤算法在计算推荐过程中将用户访问过的每个资源同等对待,这显然是不合理的。一般来说,用户近期访问过的资源对推荐该用户未来可能感兴趣的资源起比较重要的作用,而早期的访问记录对生成推荐影响相对较小,这是因为用户的兴趣随时间的推移不断变化,而在较短的一段时间内用户的兴趣是相对稳定的,因此一个用户感兴趣的资源最可能是他近期访问过的相似资源。

    传统推荐算法只考虑用户间的相似性或项目间的相似性,而忽略了用户兴趣的动态变化,从而导致推荐精度会随时间推移而下降。本文将用户兴趣分为短期兴趣集合S和长期兴趣集合L,通过时间窗口来控制和判断,当时间窗口内对商品类别p的访问次数超过阈值,将p加入短期兴趣集合S。在时间窗口外,将访问次数大于所有商品类别平均访问次数的加入长期兴趣集L。剩余的标识为无兴趣。具体操作步骤如下:(1)设定时间窗口T的大小;(2)计算用户u对商品类别i的访问次数c;(3)设定短期兴趣判断阈值α,在时间窗口内,当c>α时,将商品类别i加入用户u的短期兴趣集合S中;(4)在时间窗口外,计算用户u对所有商品类别的平均访问次数avg_c,当c>avg_c时,将商品i加入到用户u的长期兴趣集合S中;(5)根据长短兴趣集合中的商品在“双十一”当天用户购买集合中的命中率,来确定参数T,α;(6)基于长短期兴趣列表进行TOP N推荐。

    四、实验与分析

    (一)实验设计

    1、实验数据。本文实验数据采用的是来自厦门大学数据库实验室的淘宝2015年双11交易数据集,包括了用户id、商品id、商品类别、用户操作行为类型(包括点击、加购物车、购买和关注商品)和操作时间。

    2、评估指标。精准率指分类正确的正样本个数占分类器判定为正样本的样本个数的比例,召回率指分类正确的正样本个数占真正的正样本个数的比例,F1 score是精准率和召回率的调和平均数,见式(1)。

    (1)

    (二)实验结果与分析

    1、长短兴趣划分。通过用户历史数据来提取用户的长短期兴趣列表,然后对比预测日当天用户的实际购买行为,来获取预测的准确性。根据长短兴趣提取规则,时间窗口大小T和短期兴趣判断阈值α能影响实验结果,因此根据时间窗口T和短期兴趣判断阈值α的不同取值进行对比实验。(图1)

    由图1可知,时间窗口相同的情况下,随着α值增大,F1-score呈现先增长后减小的趋势。在相同α取值下,随着时间窗口增大,F1-score呈现先增大后减小的趋势。本文实验中,当T=11,α=1时,长短期兴趣提取规则的F1-score最高。

    2、基于长短期兴趣列表的TOP N推荐。根据用户长短兴趣区分及用户兴趣模式研究,可以得到长期兴趣列表和短期兴趣列表,在对用户进行TOP N推荐时,需要考虑推荐列表中元素的排序问题。首先考虑不区分长短兴趣的排序问题,即将长期兴趣推荐列表中元素和短期兴趣推荐列表中元素混合,然后根据用户u对项目i的操作频次降序排列,选取频次最高的前N个元素进行推荐。

    根据实验结果,对于短期兴趣推荐列表,精准率为42.54%,召回率为20.11%,F1-Score为27.21%;对于长期兴趣推荐列表,精准率为17.08%,召回率为25.56%,F1-Score为20.47%。故短期兴趣推荐列表中的精准率远高于长期兴趣推荐列表,而召回率略小于长期兴趣推荐列表。综合来看,短期兴趣推荐列表的F1-Score值比长期兴趣推荐列表高6%左右,因此短期推荐列表的推荐效果更好,基于长短期兴趣列表的TOP N推荐中,应区分长短期兴趣,优先推荐短期兴趣、然后推荐长期兴趣,不足N个时用最高频次的无兴趣列表中元素补充。

    为了比较本文提出的算法与传统算法之间捕捉用户兴趣漂移的效果,将本文的混合模型与传统应对兴趣漂移的遗忘曲线、时间窗口和基于矩阵分解的协同过滤算法进行对比。(图2)

    图2给出了不同TOP N推荐数目N对推荐F1-Score的影响,其中N分别取值5、10、15、20、25。比较本文模型与基于矩阵分解的协同过滤、遗忘曲线和时间窗口算法,在不同N取值下本文模型的F1-Score均高于遗忘曲线和时间窗口,说明了本文模型在捕捉用户兴趣漂移的良好效果。

    五、结论

    用户的兴趣随着时间的变化是不断变化的,用户兴趣模式可以分为长期兴趣和短期兴趣,通常来说,长期兴趣比较稳定,而短期兴趣不稳定。本文首先通过用户长短期兴趣模式的区分和识别研究,得到用户长期兴趣列表和短期兴趣列表。针对长短期兴趣推荐排序问题,通过对比试验结果,基于长短期兴趣列表的TOP N推荐应区分长短期兴趣,并优先推荐短期兴趣、其次推荐长期兴趣。对比于时间窗口、遺忘曲线和基于矩阵分解的协同过滤算法,本文算法在F1-score上获得更好的效果。

    本文基于用户描述文件计算用户兴趣偏好时,结合长短期兴趣模型,优化了推荐中随时间变化的兴趣漂移问题,同时提取了长短期兴趣集合、用户活跃度、项目流行度相关指标,可为用户自动打标签,为后续研究或者网站功能扩展提供更多选择。同时,细分用户长短期兴趣之后,可以持续追踪用户长短兴趣之间的演化机制,进一步研究用户兴趣的动态演化过程,具有很强的现实意义和应用价值。

    主要参考文献:

    [1]艾媒新零售产业研究中心.2019中国电商半年度发展全景报告[EB/OL].艾媒网,2019.

    [2]Shtykh R Y,Jin Q.Dynamically constructing user profiles with similarity-based online incremental clustering[J].International Journal of Advanced Intelligence Paradigms,2009.1(4).

    [3]Lee S K,Cho Y H,Kim S H.Collaborative filtering with ordinal scale-based implicit ratings for mobile music recommendations[J].Information Sciences,2010.180(11).

    [4]Li L.,Zheng L.,Yang F.,et al.Modeling and broadening temporal user interest in personalized news recommendation[J].Expert Systems with Applications,2014.41(7).

    [5]Bennett P.Modeling the Impact of Short- and Long-Term Behavior on Search Personalization[C].International Acm Sigir Conference on Research & Development in Information Retrieval.ACM,2012.

    [6]冯永,张备,强保华,张逸扬,尚家兴.MN-HDRM:长短兴趣多神经网络混合动态推荐模型[J].计算机学报,2018.

    [7]黄敦贤.推荐系统中的用户动态兴趣模型研究[D].华南理工大学,2018.

    [8]吕学强,王腾,李雪伟,董志安.基于内容和兴趣漂移模型的电影推荐算法研究[J].计算机应用研究,2018.35(3).

    [9]伍大清,阳小华,马家宇,胡东,吴取劲.基于隐式反馈的用户兴趣漂移方法[J].计算机应用与软件,2010.27(9).

    [10]王晓春,李生,杨沐昀,赵铁军.一种长短期兴趣结合的个性化检索模型[J].中文信息学报,2016.30(3).

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/13 18:49:52