网站首页  词典首页

请输入您要查询的论文:

 

标题 一种基于旅游需求模板的景区评价数据分析舆情满意度方法
范文

    郑俊+楼佳媛

    

    

    

    摘 要: 提出基于旅游需求模板的景区评价数据分析舆情满意度方法。通过基于旅游需求模板的关键词模板库构建、关键词模板库的扩充、针对景区评价数据的舆情满意度的分析和景区舆情与满意度分析模型的构建,给出了具体实施方式,解决了以往游客游记、评价等非结构化内容难以被其他游客高效搜索利用的問题,不仅可以向游客提供某个景区的综合满意度值,还可以向游客提供该景区具体的关于吃、住、行、游、购、娱六个方面的满意度值,以及比吃、住、行、游、购、娱更具体的相关内容的满意度值,从而让游客快速了解该景区的各个评价参数。

    关键词: 关键词模板库; 景区舆情; 满意度; 评价数据

    中图分类号:TP391 文献标志码:A 文章编号:1006-8228(2017)03-62-03

    Abstract: This paper puts forward a method of analyzing public opinion and satisfaction on the evaluation data of scenic spots based on tourist demand template. By means of keywords template library building and expansion based on the template of tourism demand, the paper analyses and builds the model of the public opinion and satisfaction on the evaluation data. It solves the problem that unstructured content such as tourists' travels and evaluation cannot be efficiently searched and utilized by other tourists. It can not only provide tourists with scenic spots' comprehensive satisfaction value, but also satisfaction values in the specific area of cuisine, housing, transportation, travelling, shopping, and entertainment, and even more specific related content of the satisfaction value in those six aspects. Thus it helps visitors quickly understand the evaluation of the various parameters of the area.

    Key words: template library; public opinion of scenic spots; satisfaction; evaluation data

    0 引言

    随着经济的发展,现在已经进入旅游智能化阶段和大数据的时代,游客通常通过查看媒体互动分享评价来决定自己旅游计划。然而,传统游客在游记中对景区景点的评价内容是非结构化、离散的,即难以采用一定的算法对其进行有规律地提取和组织,从而导致不能采用计算机智能对其提取分类。然而游客对“吃、住、行、游、购、娱”的评价获取需求颇为急切,因此需要采用一种新的技术来实现游客评价的自动化提取并对大量的数据进行高效的有价值的分析[1-3]。

    1 本文提出的方法步骤及特征

    本文提出一种基于旅游需求模板的景区评价数据分析舆情满意度方法,主要有基于旅游需求模板的关键词模板库构建(见图1)、关键词模板库的扩充(见图2)和针对景区评价数据的舆情满意度分析计算三个步骤。该方法的特征在于:所述的旅游需求模板主要由内容大类关键词、内容子类关键词和情感关键词构成,每个内容大类关键词下分属有其对应的内容子类关键词,每个内容子类关键词下分属有其对应的情感关键词[4-5]。

    1.1 基于旅游需求模板的关键词模板库构建

    主要由基于旅游需求模板引导评价的内容大类关键词、内容子类关键词和情感关键词构成,每个内容大类关键词下分属有其对应的内容子类关键词,每个内容子类关键词下分属有其对应的情感关键词。

    关键词模板库初始由列举而成,所述的内容大类关键词包括吃、住、行、游、购、娱的六个类别;所述的内容子类关键词是在内容大类关键词的基础上构建的;所述情感关键词是对内容子类关键词的描述性词语。

    1.2 关键词模板库的扩充

    关键词模板库的扩充具体是采用以下方式对内容子类关键词和情感关键词进行扩充:

    ⑴ 在已构建的关键词模板库基础上,通过网络爬虫工具在内容大类关键词所在段落文字附近搜索内容子类关键词,将找到的在已构建关键词模板库中不存在的内容子类关键词作为新的内容子类关键词,并加入到关键词模板库中;

    ⑵ 在已构建的关键词模板库基础上,通过网络爬虫工具在内容子类关键词所在段落文字附近搜索情感关键词,将找到的在已构建关键词模板库中不存在的情感关键词作为新的情感关键词,对新的情感关键词赋权值后加入到关键词模板库中。

    1.3 针对景区评价数据的舆情满意度分析计算

    所述针对景区评价数据的舆情满意度分析计算具体是:由扩充后的关键词模板库通过网络爬虫工具搜索景区下的文字数据,抽取出内容大类关键词所在段落文字附近的内容子类关键词,再搜索抽取出每个内容子类关键词所在段落文字附近的情感关键词,从而获得所有情感关键词及其每个情感关键词对应的内容子类关键词和内容大类关键词,然后构建景区舆情与满意度的分析模型,通过景区舆情与满意度的分析模型获得以平均满意度值作为该景区的舆情满意度值。

    2 景区舆情与满意度的分析模型

    ⑴ 先采用以下公式计算获得文字数据中所有评论中的关于某一个内容子类关键词的满意度值:

    其中,表示第i个内容大类关键词下第j个内容子类关键词的平均满意度值,t是分值(1~5),表示i个内容大类关键词下第j个内容子类关键词对应分值为t的情感关键词的数量,Bij表示第i个内容大类关键词下第j个内容子类关键词,B{B11,B12,B13…B21,B22,B23…}代表内容子类关键词集合。

    ⑵ 再采用以下公式计算获得文字数据中一个内容大类关键词的满意度值:

    其中,表示第i个内容大类关键词的满意度值,表示第i个内容大类关键词下第j个内容子类关键词的权值,n表示第i个内容大类关键词下内容子类关键词的数量,A{A1,A2,…,A6}代表内容大类关键词集合。

    ⑶ 再采用以下公式计算获得该景区的综合满意度值:

    其中,Y表示景区的综合满意度值,i表示内容大类关键词的序号,i取值范围是1~6,表示第i个内容大类关键词下的的权值。

    3 具体实施方式

    3.1 基于旅游需求模板的关键词模板库构建

    ⑴ 内容大类关键词构建,主要包括吃、住、行、游、购、娱几个大类。

    ⑵ 内容子类关键词构建,主要是在内容大类关键词的基础上构建,比如和内容大类关键词吃相关的内容子类关键词有饭店、餐馆、快餐店、小吃街等。

    ⑶ 情感关键词构建,主要是在内容子类关键词基础上构建,比如和内容子类关键词‘吃对应的情感关键词有味道很好,价格实惠,环境优美等。

    3.2 关键词模板库的扩充

    ⑴ 基于需求模板引导评价的内容子类关键词库扩充,通过网络爬虫工具在内容大类关键词附近搜索相关的内容子类关键词并与已有的模板库进行对比,遇到新的内容子类关键词后,自动加入到模板库,比如遇到与内容大类关键词吃相关的新的内容子类关键词野味店等。

    ⑵ 基于需求模板引导评价的情感关键词库扩充,通过网络爬虫工具八爪鱼采集器,在内容子类关键词附近搜索相关的情感关键词并与已有的模板库进行对比,遇到新的情感关键词后,自动加入到模板库。

    ⑶ 情感关键词均已由用户进行赋分,给出分值(1~5),比如非常好/棒极了/美妙极了,这三个情感词表达的满意度是相同的,对应的分值都是5分,一般/凑合/还行对应的分值则都是3分;差极了/难受死了/简直就是受罪/再也不会去了,对应的分值则是1分。

    3.3 针对景区评价数据的舆情满意度分析计算

    ⑴ 根据已有模版库构建评价体系表。内容大类关键词和内容子类关键词的权重和情感关键词的分值以及相同分值评论数量如表1所示,表中{}表示第i个内容大类关键词下第j个内容子类关键词对应分值为t的情感关键词的集合。

    ⑵ 通过网络爬虫工具搜索景区网页的每个帖子,按内容子类关键词,搜索所有相关的情感关键词,根据表1进行分类统计,把相应的情感关键词的数量记录到对应到中。

    比如:通过网络爬虫工具搜到网页得到1000个情感关键词,有600个是与内容大类关键词‘吃A1有关的,其中300个是与内容子类关键词‘味道B11有关的,对应的情感关键词集{}及数量如表2所示。

    由内容子类关键词满意度计算公式可知该景区关于吃的味道的满意度值为:

    即:该景区关于吃的味道的满意度值为3.6,同理可以计算其他内容子类的关键词的满意度值。

    4 结束语

    通过这种方法得到满意度值,解决了以往游客的游记、评价等非结构化内容难以被其他游客高效搜索利用的问题,除了可以向游客提供某个景区的综合满意度值外,还可以向游客提供该景区具体的关于吃、住、行、游、购、娱六个方面的满意度值,以及比吃、住、行、游、购、娱更具体的相关内容子类关键词的满意度值,让游客快速了解该景区的各个评价参数。

    参考文献(References):

    [1] 维克托.迈尔舍恩伯格著,盛杨燕,周涛译.大数据时代:生活、工作与思维的大变革[M].浙江人民出版社,2013.

    [2] 马建光,姜巍.大数据的概念、特征及其应用[J].国防科技,2013.2:10-11

    [3] 黄先开,张丽峰,丁于思.百度指数与旅游景区游客量的关系及预测研究-以北京故宫为例[J].旅游学刊,2013.11:93-100

    [4] 赵风霞.基于數据挖掘的旅游智能推荐系统的研究和设计[J].科技创新与应用,2013.4:2-4

    [5] 徐波林,李东和,钱亚林,刘燕桃.智慧旅游:一种新的旅游发展趋势-基于现有研究成果的综述[J].资源开发与市场,2013.3:7

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2024/12/22 16:22:18