标题 | 大数据和旅游统计 |
范文 | 文玲+李瑛 一、现状评估:市场需要专业的旅游数据分析公司 伴随着智慧旅游建设,越来越多的省份把旅游大数据建设提到了议事日程,甚至很多省份已经完成了阶段性平台建设工作。一个共同现象,是由IT公司做建设方案,用政府采购方式进行开发。几年下来,建设和应用的实际融合,仍然是面临的主要问题。以笔者多年业内实际工作的经历,从第三方的角度去看,核心是必须改变以IT公司为主导建设旅游大数据的局面。旅游产业远不像作为旅游者所理解的那样简单,实践已经发展到了供给细分的阶段,市场需要专业的旅游数据分析公司。 比如,现在公认的旅游大数据在旅游行业的应用,主要是旅游市场细分、旅游营销诊断、景区动态监测、旅游舆情监测等。目的是提升协同管理和公共服务能力,推动旅游服务、旅游营销、旅游管理、旅游创新等变革。但几乎所有的大数据建设方案都不包含旅游统计。 大数据、旅游数据、旅游统计数据,是旅游大数据涉及到的3个数据层次。“大数据”提供了可供测算的基础和技术方法,“旅游数据”是将各种单一数据汇集、挖掘形成各类需要的数据,以便为旅游管理工作提供数据支撑。而“旅游统计”则是按照国家旅游局和国家统计局用法规形式规定的数据产生格式形成并发布的权威数据,具有法律效力。旅游统计是旅游数据中最重要的一个部分,是旅游数据的顶层数据。旅游数据的应用是建设大数据平台的核心数据需求,远离核心数据需求的旅游大数据平台,就像无水之源、无本之木,对旅游管理者来说,无异于隔靴瘙痒。 让IT公司做旅游统计,是其技术背景所无法承担的,也偏离了IT公司本身的业务方向。即使IT公司搭建出了符合旅游统计需求的大数据平台,后续持续的数据分析工作也是IT公司所无法承担的。如果能够承担,只能说明IT公司转型成功,已经成为一家专业的旅游数据分析公司。 二、专业评估:对旅游统计的大数据认识 (1)旅游统计 长期以来,我国的旅游统计依据国家旅游局和国家统计局颁布的《旅游统计调查制度》,统计项为“人数”和“收入”。2000年,国家旅游局引入了和国际接轨的旅游卫星账户核算方式,计算旅游产业的规模和贡献。但数据采集方式仍然是基于传统统计学的填报和抽样调查。 比如游客数量,既不是到达目的地的总人数,也不是过夜人数,而是规模以上酒店入住游客的前台登记人数,叫“人次”。游客的定义是离开惯常地10千米超过6小时,不以赚钱为目的的活动。定义比较宽泛,界定困难,特别是一日游游客的界定。另外,旅游收入的计算依据是按照万分之三的样本比例进行的游客花费调查,以人均天花费,乘以“人天”数(人次数乘以酒店填报的人均入住天数),就是目的地的旅游总收入。 从上述数据的逻辑关系,很容易看到弊端:酒店登记的统计口径不全,游客花费调查的准确度不高,“散客化、网络化的市场特征使得原有统计体系无法全面反映旅游市场的规模和发展”。随着散客时代的到来,不住酒店的游客人数越来越多,混业经营越来越普遍,传统的统计方法面临越来越多的挑战。 (2)大数据应用于统计是必然趋势 信息技术和大数据的发展,为解决棘手问题提供了新的思路和手段,大数据是信息技术普遍应用的结果,将之纳入旅游统计是发展的必然趋势。 过去,游客数量和收入无法从需求上获得,只能从供给上即各个接待游客的企业找数据。现在,游客位置信息的技术手段很多:卫星定位、基站位置、手机位置、APP等,旅游收入的数据源也很多,如短消息通知、刷卡、小额支付、OTA预订、网络支付、APP记账、旅游攻略及晒账单等。这些数据由于具有客观性特点,其可信度大大高于调查问卷。但是,上述信息都不同程度的存在着达不到100%的情况,被“大数据就是全数据”这种说法所质疑。 “大数据就是全数据”出自著名的《大数据时代》(【英国】 维克托等著)一书:“不是随机样本而是全体数据”,案例是美国人口普查由于计算机处理能力的提高而由抽样变成了全量统计。这个案例指的是技术处理方式的全样本,并非要我们在做所有数据时一定要把所有样本都纳入。比如书中所举美国孟山都公司大数据分析的,就不是美国所有农户,而仅是所服务的农户。再比如,携程、百度等发布的中国旅游大数据报告、春节期间人口迁徙大数据报告等,都是采集于自己的用户信息。但这并不影响数据报告的价值和意义。因此,在大数据的应用上,我们不宜过分纠结在是否包括了每一位游客。过分追求数据的全量化反而使得问题更复杂,并且更不具有经济性。 数据源的“全”并不能保证数据的“准”。保证数据准确性的关键,不是数据的“全”,而是数据处理过程中的科学性、专业性和严谨性,加上认真负责不怕麻烦的工作态度。 比如三家运营商的手机数据是“全”数据,但它们并不准确,需要到实际中调查摸底携帶两部手机的比例,老人儿童携带手机的和不携带手机的比例。再对三家运营商的数据进行统计看总量和比例,设定调整系数,从而得出比较科学的结论。 需要强调的是,数据的验证和校准,是一项非常繁琐的工作,需要线上线下一起努力。 三、顶层设计:云端下的目的地分级旅游大数据平台 2016年,国家旅游局局长李金早提出了“体系统一、科学适用、方法创新、合作接轨、世界眼光”的改革方向,着手建立国家-省-市-县四级旅游数据中心的体制模式。 顶层设计是四级目的地大数据平台建设成功与否的关键。 1. 从需求上,分为数据和应用系统两大块。包括一级科目、二级科目、衍生性科目以及扩展性专题应用系统。所谓一级,即必须要通过大数据平台实现的数据项,如游客分类数量的认定、境内外旅游收入、分季度的舆情分析、黄金周数据等;二级是现在国家没有统一要求做但以后一定要做、现在积累数据打基础的科目,如旅游产业的数据、旅游与可持续发展关系的数据等;衍生性科目,是指旅游市场细分、旅游营销诊断、景区动态监测等;专题性应用系统,是根据上述系列数据所做的带有共性的专题做一个个的应用系统,如旅游客源地市场分析、旅游支出绩效评估体系等。应用系统是可扩展的,各地可根据自身旅游特点和侧重,依据强大的数据矩阵,量身建设应用系统,扩展数据模型。如舒适度指标、乡村旅游就业、旅游经营对乡村旅游环境的改善等。 2. 从架构体系上,包括4个层面:(1)汇集各种原始“数据源”,能够罗列出来的就有几百种。比如仅与游客数量类有关的的数据源:机场、酒店、景区、旅行社、手机、APP、GPS、公交卡、游船、邮轮……(2)对各个数据源的数据处理和识别,形成对县域旅游数据和统计有价值的“源数据”。如位置信息是一种“数据源”,通过对位置信息的处理和识别,抓取出游客的人数及分布,才能成为对旅游数据有价值的“源数据”。(3)通过对“源数据”的处理建设框架体系。在框架体系中,充分融合各类“源数据”,成为统一标准、可统一识别的“数据元”。建设一个可随时填充、可扩展、不以数据源多少为制约的“旅游大数据框架体系”。以后随着应用和时间的积累,数据越来越多,数据的准确度将越来越高。(4)针对旅游指标体系的各种数据形成小系统和专题应用系统。根据目的地旅游管理的需要,提出工作流程和工作计划,在不同的时间节点生成不同的数据和工作模板,供工作人员使用。 四级旅游数据中心的体制,建立了一套适应旅游新业态发展、符合信息技术发展趋势的大数据模型和数据采集、挖掘、统计、分析的模型。各个目的地专家将在旅游大数据的支撑下,与各级旅游管理部门紧密结合,在经济上和研究成果上走出一条产学研的新路子,带动研究和决策水平的双提高。 |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。