基于网络数据挖掘的江苏省在线与现实旅游流规模耦合研究

    涂玮

    摘 要:基于网页数据挖掘,借助耦合分析方法,探讨在线旅游流与现实旅游流规模的关系,研究发现江苏省在线与现实旅游流规模总体较为协调,区域网络营销水平与旅游业发展基本相当。但13个市域中有5个市域在线旅游流与现实旅游流规模处于轻度失调状态,占江苏省内13个市域的38.46%;无锡市在线旅游流与现实旅游流规模处于良好协调状态。

    关键词:在线旅游流;现实旅游流;耦合

    1 研究背景

    网络营销系统下产生的旅游流与旅游目的地的真实旅游流分属于不同的系统,一个为真实地理空间下的旅游流,一个为网络营销“网络空间”下产生的旅游流,但这两个系统之间存在一定的响应关系,甚至能够起到引导和预测作用。路紫教授[1]指出网络空间信息流对现实旅游流具有引导作用。因此必须密切关注在线信息引发的旅游流与现实旅游流的关系。虽然国内外学者对旅游流规模的研究取得了较为深入的进展[2-4],但是基于信息化时代探究在线旅游信息而引发的在线旅游流规模及与现实旅游流规模的关系研究还较少。因此文章基于Web文本数据挖掘,以江苏省为例,深入研究在线旅游流与现实旅游流规模之间的耦合性,通过研究发现区域旅游网络营销的不足,为江苏省区域网络营销提供参考。

    在线旅游流规模是指旅游者通过在线旅游产品购买,而产生的流向泛长三角不同区域的旅游流量。旅游者对在线旅游产品消费具有一定的偏好性,不同的产品特征会引发不同的市场购买量,正是因为在线旅游产品吸引力不同,从而呈现消费者的购买量不同,从而引发了旅游者对不同旅游目的地的流动,流动量的大小即为在线旅游流规模。

    2 数据来源

    Analysys易观智库数据监测显示,2015年攜程、去哪儿、阿里旅行等大型在线旅游企业占据在线旅游市场79%的市场份额。其中携程、去哪儿在线旅游市场总和为55.9%。因此本次研究数据来自于两大在线服务商,即携程与去哪儿网。两大网站知名度高、交易量大保证了在线获取的旅游流数据具有一定的代表性和普适性。

    基于在线数据,利用网络爬虫抓捕工具,抓捕2015年9月泛长三角41个市级行政单元旅游产品名称、线路的空间转移、产品的购买人数。之所以选择9月,是因为9月正处于十一黄金周前夕,此时在线旅游产品营销力度大,市场需求旺,在线信息数据丰富。

    通过两大网站获得具有在线购买资格的产品共1 519条,去哪儿网共计783条、携程旅游网共计736条。江苏省每个市域的在线旅游流规模统计方法如下:对于单节点旅游线路在线购买量直接归属到地级市的客流;对于多节点旅游产品,根据节点分别归属到每一个地级市客流,如“华东三日游”该线路经过南京—无锡—苏州—南京,则将该产品的购买量分别归属到南京市、无锡市、苏州市。本研究中江苏省区域各地级市现实旅游流规模数据的获取主要来自2015年江苏省各市国民经济与社会发展公报。

    3 研究方法

    3.1 变异系数

    系统耦合的概念开始之初来源于物理学,指两个或者两个以上的系统或运动方式之间通过各种相互作用而彼此影响以至协同的现象。后来,耦合的概念渗透到生物学、农学、地理学、旅游学等领域。旅游学是交叉学科,受到诸多学科的影响。借鉴已有相关研究成果[15]本研究采用变异系数来推导在线旅游流与现实旅游流规模之间的耦合性。变异系数又称为离散系数,反映两组数据的离散程度。变异系数的计算公式如下:

    公式中CV取极小值的充要条件是取极大值,因此可以推导出耦合度公式为:

    公式中C为耦合度,k为调节系数,一般2≤k≤5,为了增加区分度,本研究取k=2,x为在线旅游流规模无量纲化值,取为0.1~0.9之间,y为现实旅游流规模无量纲化值,取为0.1~0.9之间,从公式中可以看出,C的取值在0~1之间,值越大,在线旅游流规模与现实旅游流规模耦合度越好,反之耦合度越差。

    3.2 耦合协调度模型

    耦合度C是反映网络营销下产生的旅游流规模与现实旅游流规模相吻合的重要指标。然而耦合的情况很多,如低水平的耦合、高水平的耦合,如某地级市10月份游客量较少,而网络营销产生的游客量也比较少,则该地级市在线旅游流规模与10月份现实旅游流规模的耦合度较高,不代表两者处于最优状态。因此系统在良好耦合的状态下不代表处于最优的状态,因此引入耦合协调度概念,耦合协调度计算公式如下:

    式中R为耦合协调度;C为耦合度;P为协调发展度;x为在线旅游流规模无量纲化值,y为现实旅游流规模无量纲化值。α,β为待定权数,在计算过程中,鉴于旅游产品营销手段的多样性,在线营销仅仅是旅游营销的手段之一,因而取α为0.4,β为0.6。

    耦合协调度越高,表明在线旅游流规模与现实旅游流规模较高,也说明了两者之间的耦合关系较好,旅游网络营销在旅游流的产生上具有非常明显的效应和作用。

    为了更好地判断在线旅游流规模与现实旅游流规模耦合协调度等级,对耦合协调度进行等级划分,划分依据如表1所示。

    4 江苏省在线与现实旅游流规模耦合性分析

    在进行耦合性分析前,利用相关性分析对江苏省在线旅游流与现实旅游流的规模进行相关分析,pearson相关性分析结果显示,江苏省各市域在线旅游流规模与现实旅游流规模的相关性系数达到0.881**,可见相关性较高。为了进一步揭示各地级市现实与在线旅游流规模的关系,利用耦合协调模型开展研究。在线旅游流和旅游目的地现实旅游流规模的数量级不同,根据耦合协调度模型应将其标准化为0~1之间的数值,以便于进行模型的计算,为避免出现0值和1值,本研究根据改进的极差法对数据进行归一化,使其取值区间在0.1~0.9之间,具体公式如下:

    公式中pi为yi指标转换后的无量纲化值,yi为实际值,min(yi)为所有地级市客流最大值,min(yi)为该项指标的最小值。

    数据经过无量纲化后,计算江苏省13个地级市在线旅游流与旅游目的地现实旅游流耦合状况,结果如表2所示。

    (1)江苏省内13个市域,有5个市域在线旅游流与现实旅游流规模处于轻度失调状态,占江苏省内13个市域的38.46%。从优先度来看,这些市域基本上都是在线旅游流相对滞后,连云港、南通、淮安、盐城表现最为明显,网络营销相对于现实旅游业发展而言比较落后。从区域分布来看,这些市域基本上分布沿江和徐宿淮旅游圈。這一点与江苏省在线旅游流规模空间结构是相吻合的,如图1所示。图1江苏省在线旅游流规模空间热点现实,苏北、沿江在线旅游流规模是冷点,在线网络营销所带来的客流量较低。

    (2)镇江、徐州、泰州在线旅游流与现实旅游流规模处于濒临失调状态。镇江市、徐州在线旅游流相对滞后,旅游网络营销比较落后。

    镇江拥有“三山”5A级旅游景区。2012年全年实现旅游总收入452.9亿元。接待国内外旅游者3 569.2万人次。而相对于现实旅游业而言,在线旅游营销的产品数量较少,仅有少数酒店产品,与江苏省内其他市域联合的旅游线路少之又少,从优先度来看,镇江在线旅游网络营销滞后。徐州作为江苏苏北的龙头,其以汉文化为主体的旅游资源已经有了一定的品牌知名度,南秀北雄、汉风楚韵已经为很多旅游者所熟知,再加上徐州有较多的免费开放型景区,因此旅游业发展较好,但由于地处经济落后区域,思想观念和网络经济都相对滞后,因此网络营销明显滞后,今后应不断地加强网络营销,发挥旅游网络营销的效应。泰州市地处苏中地区,具有溱湖湿地、溱潼古镇等知名旅游资源,泰州紧邻苏南地区,在线旅游网络营销相对发达,甚至赶超了现实旅游发展。

    (3)扬州市在线旅游流与现实旅游流规模处于勉强协调状态。扬州2012年全市接待境内外旅游人数3 638.49万人次,实现旅游总收入435.23亿元,位列全省第六。扬州瘦西湖景区为5A级旅游景区,成为扬州旅游发展的核心旅游资源。但扬州在线旅游产品主要集中在与南京、苏州、无锡之间的联合产品,与镇江、常州、泰州等市域的联合旅游产品较少,从优先度来看,扬州在线旅游网络营销相对滞后。

    (4)常州市在线旅游流与现实旅游流规模处于中级协调状态。常州具有三大主题公园还有以自然风光为主的天目湖四大核心旅游资源,常州恐龙园为国家5A级旅游景区,2012年常州市实现旅游总收入520.34亿元,旅游接待总人数4 003.84万人,常州旅游网络营销比较发达,尤其是三大主题公园的单项不同类型产品众多,旅游者可以实现在线随意多选择购买,因此总体而言,常州的在线旅游流与现实旅游流规模处于相对协调状态,从优先度来看,常州旅游的在线旅游网络营销更加超前,这与常州的三大主题公园的市场化运作模式密切相关。

    (5)无锡市在线旅游流与现实旅游流规模处于良好协调状态。无锡市无论从在线旅游流规模还是从现实旅游流规模来看发展都相对较好,是处于较高水平的耦合状况。无锡与其他城市的联合在线旅游产品较多,且单项旅游产品也较多。从优先度来看,无锡在线网络营销要优先于现实旅游发展,说明网络已经成为城市旅游业发展的引擎和重要营销媒体。

    (6)南京市、苏州市在线旅游流与现实旅游流规模处于优质协调状态。南京作为省会城市,在线旅游流与现实旅游流发展基本同步,属于高水平耦合状态。苏州具有同程网,旅游网络营销发达,更是省内非常著名的旅游目的地,在线旅游流与现实旅游流属于高水平耦合状态。从优先度来看,苏州虽然旅游网络营销水平较高,但仍然相对滞后于现实旅游业的发展。

    (7)总体而言,耦合协调度分析显示,江苏省内在线旅游流与现实旅游流规模耦合情况大致可分为6种类型,分别为优质协调、良好协调、中级协调、勉强协调、濒临失调、轻度失调,如图2所示。且6种类型的分布在空间上具有一定的规律性,苏北、沿江大都处于轻度失调状态,苏南、苏中大都为较好或基本协调状态。

相关文章!
  • 融合正向建模与反求计算的车用

    崔庆佳 周兵 吴晓建 李宁 曾凡沂<br />
    摘 要:针对减振器调试过程中工程师凭借经验调试耗时耗力等局限性,引入反求的思想,开展了

  • 基于MATLAB 的信号时域采样及

    唐敏敏 张静摘要:频率混叠是数字信号处理中特有的现象,发生频率混叠后,信号会分析出错误的结果。而采样过程中,由于频率不够高,采样出

  • 数字化课程在教学中应用的思考

    杨新桥 苑嘉航摘 要:随着数字化课程的兴起与不断发展完善,越来越多的高校在许多专业的教学中也引入了数字化课程,数字化课程依托其天