网站首页  词典首页

请输入您要查询的论文:

 

标题 基于朴素贝叶斯方法的个性化旅游路线推荐系统
范文 徐盼++程保杰++吴倩++吕超++谷晴++肖文杰
摘 要:旅游路线的选择与多种因素有关,如游客年龄、旅游季节、景点类型、游览时间等,如何较好地针对不同游客特点进行个性化旅游路线的设计与推荐,一直是旅游工作者的首要目标。把应用数据挖掘技术的朴素贝叶斯方法应用到个性化旅游路线推荐系统中,是一个新的尝试。通过对蜂窝网的旅游攻略进行文本处理,得到丰富的旅游路线训练数据,然后使用朴素贝叶斯方法为特定需求的用户提供个性化路线推荐。推荐结果通过召回率、准确率两个指标进行评价。结果显示,利用朴素贝叶斯方法可以为用户提供与之需求相符合的个性化旅游路线。
关键词:朴素贝叶斯;个性化旅游路线;推荐系统
DOIDOI:10.11907/rjdk.1511002
中图分类号:TP319
文献标识码:A 文章编号文章编号:1672-7800(2015)012-0152-02
0 引言
近10年来,在电子商务领域,个性化推荐技术应用最为广泛。通过使用个性化推荐技术,可以根据用户的特定需求从海量信息中过滤无关信息,挖掘有用信息,从而为用户提供个性化的推荐服务,以方便用户决策。
个性化推荐技术主要有以下4种推荐方法[1]:①基于内容的推荐,指根据用户选择的产品,向用户推荐与该产品属性相似的其它产品;②基于协同过滤的推荐,主要指根据用户对产品的偏好,将与该用户偏好相似的其他用户选择的产品推荐给该用户;③基于知识的推荐,该方法通过对特定领域的知识指定规则进行基于约束的推荐和基于实例的推荐;④基于社会媒体的推荐,主要是利用集体智慧,将社会媒体中用户间的社会关系或其它媒体数据运用于推荐中。例如:将与目标用户关系最密切、在社区中影响力大,或与目标用户在同一群组中的其他用户购买过且该用户未购买的产品推荐给该用户。
朴素贝叶斯方法是统计学分类方法,作为数据挖掘领域的经典算法,朴素贝叶斯方法在不同领域有着广阔的应用前景。在特征项独立的条件下,该方法预测的准确性超过了神经网络和基于向量机算法[2]。而在个性化旅游路线推荐领域,并没有相关文献介绍使用朴素贝叶斯方法对旅游路线进行推荐。
当前有多种途径可以挖掘到游客的旅游路线信息,如:上传的旅游景点图片、基于GPS的旅游轨迹,以及旅游攻略与旅游日志[3]。因为上传的旅游景点图片只是旅游路线的部分景点,不是完整路线,作为训练数据会降低个性化推荐的准确性。而旅游攻略是对旅游过程的完整描述,旅游路线及游客兴趣等特征都容易获取,非常适合朴素贝叶斯方法。因此在本系统中,将以蜂窝网的旅游攻略作为数据来源[4]。
1 系统概述
基于朴素贝叶斯方法的个性化旅游路线推荐系统由以下4部分组成,分别为:用户界面模块、游客旅游路线数据库、朴素贝叶斯训练模块、旅游路线排序模块[5]。不同模块在系统中承担不同功能。
该系统操作流程如下:①系统提供一个用户操作界面,在界面提供了旅游周期、人均旅游预算、游客关系、游客喜欢的景点类型、旅游季节、游客之间的关系等选项供用户选择。当用户按照提示将信息填写完整后,可以进入下一步;②系统后台调用数据库中存储的旅游路线信息,通过朴素贝叶斯模块预测用户在指定条件下最有可能选择的旅游路线;③界面将按照旅游路线的可能性降序排列,如果存在可能性一样的路线,将以旅游路线的获赞数为第二关键字降序排列,用户可根据自身需要选择合适的旅游路线。
该系统的核心模块是朴素贝叶斯训练模块。为方便实验,选择蜂窝网上1 000份张家界旅游攻略,作为贝叶斯模块学习的训练数据。而在训练过程中,最关键的部分是对训练数据的要求。不仅要求大量的训练样本,而且要求训练样本特征项与旅游路线相关。
为了得到充足的符合要求的旅游路线训练数据,进行了如下工作:首先利用网络爬虫技术[6]从蜂窝网上抓取1 000份张家界旅游攻略,然后通过人工方式将每一份攻略进行文本处理,挖掘与旅游路线相关的特征信息,具体特征包括旅游季节、旅游时间、旅游预算、游客之间关系、旅游路线、旅游路线获赞数、游客收入(可通过攻略内容进行推测)、游客职业、游客喜欢的旅游类型等,最后按一份攻略一条记录的形式存放在MySql数据库中。
因为不同特征项会产生不同的旅游路线,从而影响用户决策[7],所以本系统首先全面考虑影响旅游路线选择的相关因素,然后通过特征项的选择算法C4.5算法进行甄选,最后产生了如下特征项:①旅游时间;②旅游季节、旅游时间;③每天的人均旅游预算;④游客喜欢的景点类型之间的关系;⑤游客年龄构成,具体而言指是否包含儿童或老年人。
2 朴素贝叶斯学习模块实现过程
2.1 朴素贝叶斯方法原理
朴素贝叶斯方法即在满足用户指定的特征项条件下,求不同类别出现的概率,选择出现概率最大的类别作为预测结果。例如,本系统中假设用户指定特征项如下:旅游时间为1天,携带小孩老人,每天人均预算为400元人民币,喜欢的景点类别为自然风光。而在数据库存储的所有旅游路线记录中,满足上述条件的旅游线路有3条,它们出现的概率分别是0.2、0.5、0.3。贝叶斯方法即将满足用户条件下出现概率最大的第2条旅游路线作为预测结果[2]。
2.2 朴素贝叶斯定义
设T={x1,x2...xm}为特征项集合,集合中的每一项xi都是一个特征属性。本系统中假设用户输入T集合的特征属性与值如表1所示。
设C={y1,y2,..,yn}为类别集合,yj为一个分类。搜索数据库存储的训练样本,对旅游路线进行分类,集合C中的部分旅游线路如表2所示。
算。最后比较每条旅游路线的条件概率,由此得到的最大值即为贝叶斯预测结果。
3 推荐结果评价
推荐结果评价标准是召回率和准确率。召回率指系统推荐符合需求的旅游路线的数目除以系统中与需求相符合的旅游路线总数,而准确率则是系统推荐符合需求的旅游路线除以系统推荐的旅游路线总数。
笔者通过随机模拟100个客户的需求方式,计算系统推荐的召回率与准确率。结果显示, 100个随机模拟的用户产生推荐结果的准确率为0.73,召回率为0.61,结果较为理想。该结果也进一步说明采用朴素贝叶斯方法进行个性化旅游路线的推荐是可行的。
4 结语
本文为个性化旅游路线的推荐提供了一种新的思路,即利用机器学习中的朴素贝叶斯方法实现个性化旅游路线推荐系统。本文介绍了该系统的基本功能,重点描述了朴素贝叶斯方法在预测旅游路线中的实现过程,并利用准确率与召回率两个指标对系统推荐效果进行评估。结果表明,使用朴素贝叶斯方法实现个性化旅游路线推荐是可行的。
参考文献参考文献:
[1] 项亮.推荐系统实践[M].北京:人民邮电出版社,2012.
[2] JIAWEIHAN,MICHELINE KAMBER.数据挖掘概念与技术[M].范明,孟小峰,等,译.北京:机械工业出版社,2001.
[3] 李春明,王亚军,刘尹,等.基于地理参考照片的景区游客时空行为研究[J].旅游学刊,2013,10(28):30-35.
[4] 蚂蜂窝[EB/OL].http://www.mafengwo.cn/.
[5] CHAKPABORTY B. Integrating awareness in user oriented route recommendation system[C]. The International Joint Conference on Neural Networks,New Jersey:IEEE Press,2012:1-5.
[6] 罗刚,王振东.自己动手写网络爬虫[M].北京:清华大学出版社,2010.
[7] 张丽伟,段禅伦,熊志伟,等.朴素贝叶斯方法在中医证候分类识别中的应用研究[J].内蒙古大学学报,2007,38(5):568-570.
(责任编辑:黄 健)
随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/10 12:04:16