基于UGC图片元数据的目的地形象感知

2023.02.15

邓宁　钟栎娜　李宏

[摘要]互联网及社交媒体已成为目的地形象传播的主流平台，通过社交图片所构建的目的地形象已成为影响潜在游客旅游决策的重要因素。该研究以社交图片网站Flickr中北京相关图片元数据集作为研究素材，采用计算机文本分析的方法，从认知形象、情感形象两个方面对基于社交图片元数据的北京在线旅游形象进行了研究。研究表明：在认知形象方面，除了北京较为知名的景点外，传统外国人聚集区域已成为北京新的城市形象名片；而在情感形象方面，“令人愉快的”（pleasant）和“兴奋的”（exciting）是北京展现给游客的主要情感形象。此外，该研究对利用UGC图片元数据进行目的地形象感知提供了方法参考。
[关键词]UGC；Flickr；形象感知；图片元数据
[中图分类号]F59
[文献标识码]A
[文章编号]1002-5006（2018101-0053-10
Doi：10.3969/j.issn.1002-5006.2018.01.010
引言
随着互联网及Web 2.0技术的快速发展，越来越多用户将自己原创的内容通过网络平台进行发布，“由用户产生的内容（user-generatedcontent、UGC）”的概念逐渐兴起。同时，越来越多的游客通过社交网络、攻略社区等UGC平台进行旅游信息的收集和分享，海量UGC已成为影响目的地形象感知和游客旅游决策的主流渠道。其中，图片以其直观的信息传递方式成为UGC中主要信息载体之一，也成为游客对旅游目的地形象感知过程中重要的传播介质，对旅游目的地形象的传播与构建具有较高参考价值。
基于UGC数据的目的地形象研究已经成为近几年旅游研究的热点，但是囿于图片分析的难度，现有旅游目的地形象测量偏重于对网络文本的分析，基于UGC图片的目的地形象研究还为数不多，鲜有的研究主要通过问卷及访谈的方式对目的地形象进行感知，样本量较少，形象感知的完整性欠缺，且具有一定的主观性。本研究对社交网络图片元数据（metadata）及其评论（comments）进行采集和挖掘，利用计算机文本分析的方法对社交网络UGC图片元数据进行了多层次的分析，一方面希望在目的地形象研究中引人图片元数据这一新的研究维度，另一方面也为利用社交网络UGC图片进行旅游研究提供了有益尝试。
1研究综述
旅游目的地形象研究最早来源于20世纪70年代，Hunt提出旅游地形象是纯粹主观的概念——人们对非居住地所持的印象，即外界作用于人脑所形成的意识。之后，Lawson和Baud-Bovy、Dobni和Zinkhan、Crompton、Gartner等人将情感因素加入旅游目的地的定义中，强调了人类直觉、态度和心智的表达。经典的目的地形象理论根据主体的不同将目的地形象分为供给侧的投射形象（projectedimage）和需求侧的感知形象（perceived image）。近年来，在网络UGC主导的语境中，传统目的地投射形象泛化为在线形象（online image），其由目的地管理组织（DMO）和游客所发布内容共同作用并影响。在建构顺序和认知层次方面，目的地形象被广泛认为可分为认知与情感两个方面，并被认为遵从由认知形象（cognitive image）到情感形象（affectiveimage）的升华过程。其中，认知形象指的是游客对目的地的所有知识、认知和信念，是对目的地有关属性的体现，例如“建筑”“文化”“风景”等。情感形象则是指游客对于目的地各种特征和属性所表现出的心理感受（feelings）和情绪表达（emotional response），例如“精彩絕伦的”“雄伟壮丽”“令人激动”“难以忘怀的”等。目前，关于旅游目的地形象的研究多以研究者通过主观问卷的方式，从认知和感知两个方面去选择合适的维度进行测量。除了在同一时间面板上的测量外，从时间和行为的维度来看，研究者还进行了大量关于目的地形象在游前、游中、游后发生变化的研究，同时旅游形象对于重游以及推荐等意动（conative）行为的影响也是研究者关注的重点问题。
随着网络时代的发展，除了传统的问卷与量表测量外，网络文本数据成为研究者分析目的地形象的一个重要素材。然而，图片作为重要而直接的形象分析材料，在研究中使用相对较少。目前，通过图片进行的目的地形象测量主要对图片内容进行分类、研究，进而通过图片内容得出游客对旅游目的地的偏好。基于图片的目的地形象研究由来已久，图片数据来源及研究方法随着时间推移而逐渐演变。早期的图片研究多采用游客拍摄法（visitor-employed photography，VEP）的方式收集图片，游客拍照行为容易受到外界干扰和自我暗示的影响。随着数码图片逐渐取代传统图片，特别是UGC图片的丰富，为基于图片的旅游研究提供了新的素材和视角，通过分析UGC图片进行目的地形象感知成为近年来旅游图片研究的热点。UGC图片代表了以游客视角对目的地形象进行感知，其与DMO所传递的目的地形象存在显著的差异。同时，UGC图片比单纯由DMO所发布的带有广告性质的投射形象更能引起潜在游客的信任和共鸣，已经成为目的地形象传播的主要途径之一。在图片分析方法方面，现有研究主要采用内容分析和符号分析的方法，其中又以内容分析为主。内容分析法主要对图片内容进行人工判读，将图片中的主体事物依照一定规则和维度进行分类，其中，“历史”“文化”“人物”“建筑”等都是面向目的地的图片研究中的常见维度。基于图片内容的分析方法准确度较高，但是受限于人工分析时间成本过高，分析的图片数量有限，故对于海量UGC图片分析通常考虑采用计算机领域基于内容的图片信息检索技术（content based information retrieval，CBIR）。CBIR面临的主要问题就是计算机能够从图像提取的低层次特征（例如颜色、纹理、质地、形状等）与人能从图片中感知的高层次语义信息（例如对象、事件、情感等）之间存在一定的语义鸿沟（semantic gap）。近年来，大量研究通过分析可以表达更抽象含义的文本信息（textual information）试图解决语义鸿沟问题，图片元数据作为对图片内容的文本描述，也成为图片语义研究的重要素材。
总体而言，旅游目的地形象感知数据的丰富促使研究方法不断演进，基本遵循了Echtner和Ritchie最初提出的方法，先进行开放式的问题感知，形成大体的形象，再运用定量分析的方法进行量化与分析。传统基于图片内容的人工分析方法在样本量较小的情况下效果较好，而面对海量的UGC图片时，传统研究方法的局限性愈发明显：首先，现有人工方法进行图片内容识别和分类，所分析的图片数量有限，覆盖的研究范围具有局限性；其次，归类方法大多采用人工编码分类，主观性较大。利用计算机辅助技术处理和分析图片内容，可以弥补传统图片研究方法的不足，极大提高UGC图片分析的效率，是基于UGC图片元数据进行目的地形象感知研究的有益尝试。
2数据来源及感知范围
2.1数据来源
多媒体数据随着网络的发展迅速增长，全球知名的图片分享网站Flickr创办于2004年，其海量图片数据的开放性也使之成为目前社交图片研究领域较为公认的数据集合。数码图片除了图片内容数据外，通常都包含一个对于图片本身的描述信息——元数据（metadata），其中记录了图片的拍摄时间、地点等附属信息。本研究采用了Flickr于2015年发布的元数据集——YFCC 100M。该数据集包含了1亿个媒体对象的元数据信息，其中约9920万张照片及80万条视频，所有多媒体文件均拍摄于2004—2014年之间。YFCC 100M中每一行代表一张图片的元数据信息，其主要包括以下字段：0.照片ID；1.使用者的ID；2.使用者昵称；3.拍照日期；4.更新日期；5.拍照设备；6.标题；7.描述；8.使用者标签；9.机器自动识别标签；10.经度；11.纬度；12.精确度；13.照片网络版网址；14.照片下载地址；15.许可证名称；16.许可证网址；17.照片服务器地址；18.图片标识；19.照片密码；20.照片原始密码；21.扩展名。其中某些字段可能有缺失，但图片的基本描述信息可以通过元数据进行还原。
2.2感知范围
作为全球性的图片分享网站，Flickr上的用户来自全球各个国家，选择北京作为案例城市，可以了解到全球游客对北京的感知，对于提升首都旅游全球形象及营销推广具有重要的意义。本研究以地理坐标位于北纬（39.0666～41.1000），东经（115.1166～117.0666）的矩形区域内并且拍摄时间为2010—2014年的图片作为分析数据集合，对YFCC100M进行数据清洗得到共计13763张满足条件的图片，组成了针对北京目的地形象分析的研究样本。
进一步地，笔者将所有13763张图片对应的GPS坐标通过Arc GIS软件Carto进行了可视化处理，得到如图1所示的图片拍摄区域分布。从图1可看出，照片主要集中于北京二环以内及中轴线，故宫、景山、后海、天安门；而周边郊区图片相对较少，这与北京传统景点（故宫、天安门等）知名度较大且是游客来京旅游必游景点有关系。此外，颐和园、大山子、三里屯、天坛附近也是拍摄集中区域，并且首都国际机场、门头沟、怀柔、居庸关及八达岭等也有一定数量的图片分布。
3技术路线与分析方法
3.1技术路线
本研究针对UGC图片中目的地形象构成要素进行分析，其中根据目的地形象中“认知-情感”结构理论将分析的对象聚焦于图片元数据和相关图片评论。采用的技术路线如图2所示，其中图片元数据中包含的图片名称（title）、标签（tag）和描述（description）等信息可視为对图片内容的简单描述，亦即图片内容所反映的目的地认知形象的体现；图片的评论信息则反映了图片阅读者读图时的感受，其中的情感形容词一定程度上可视为目的地情感形象的体现。值得注意的是，本文所采用的方法最终得到的是基于网络UGC图片的目的地形象，其可视为由Hunter所提出的在线目的地形象在图片平台Flickr上的体现。
3.2分析方法
通过采用计算机编程语言Python 2.7编写了与本研究相关的数据挖掘工具。首先，通过对Flickr元数据集合进行地理坐标的过滤，得到拍摄地点位于北京分析范围内的照片元数据；其次，根据目的地形象理论中认知形象与情感形象的分类分别对图片元数据及其评论数据进行数据挖掘和高频词分析，得到北京相关认知形象号情感形象。
3.2.1认知形象分析
由于本研究所涉及的图片元数据和评论均为英文文本，故采用英文自然语言分析工具TextBlob对相关文本进行处理和分析。对元数据中名词词频进行统计，并将高频出现的名词视为图片内容的重点，亦即游客对北京旅游认知形象的体现。
内容与图片组成方式是图像分类的主要依据，本研究根据北京旅游目的地属性并参考Svetlana Stepchenkova对照片的分类进行了高频词的归类，共对500个（词频>9）高频名词进行了人工归类，整理出各分类维度所包含的关键词。根据图片内容将样本图片划分为7个维度，并分别统计样本图片在各维度间的数量及分布情况。此后，通过计算机对总共13763张图片元数据进行自动化的维度匹配，如果该图片的元数据信息包含维度关键词则将其归纳到该维度，共计处理总词频达23 768项。
3.2.2情感形象分析
图片评论代表了读图者对图片内容的感受，其中往往包含了表达情感和情绪的形容词，本研究将此类形容词视为对图片所传递的目的地形象的情感反馈。对图片评论中的形容词进行词频和情感极性（sentiment polarity）分析，则可反映图片所传递的情感。为了得到图片内容所产生的情感形象（affectiveimage），本研究编写了计算机程序调用Flickr API，抓取指定图片的评论数据。并对评论中出现频率大于1次并且情感强度大于0.1的形容词进行了抽取和分析，采用语义分析软件SentiWordNet对各情感形容词进行极性计算。
进一步地，本研究针对图片评论中词频排序前5名的情感形容词通过调用Flickr API随机下载了其图片评论中包含该情感形容词的原图文件各5张，并对图片内容进行了人工分析，对于图片情感倾向和图片内容之间的对应关系及图片内容、拍摄手法等进行了讨论。
4
研究结果
4.1认知形象
4.1.1认知高频词
本文对图片内容进行分析和统计，剔除了原数据中与内容无关的网址、昵称、域名等信息，共得到3325个名词高频词，共计47498频次，平均词频为14.285次。表1为前100的高频名词信息汇总。
在所有高频词中过滤诸如中国（China）、北京（Beijing）等多次重复出现的词汇，剩余高频词多以名词出现，与网络照片内容的描述更倾向于地点、景物介绍有关。如表1所示，海外游客图片相对集中的旅游景点包括：紫禁城（Forbidden City）、长城（Great Wall）、慕田峪（Mutianyu）、颐和园（Summer Palace）、古北口（Gubeikou）、金山岭（Jinshanling）、胡同（Hutong）、天坛（Heaven）、北京动物园（Beijing Zoo）、北京石雕博物馆（Beijing Stone Carving Museum）、八达岭（Badaling）、司马台长城（Simatai）等。从统计结果看，传统历史建筑所占比例较大，且与拍照热点地区保持一致。另外，人物、探险、文化、建筑等排名也较为靠前。
4.1.2认知维度
通过将图片元数据中词频高于9的名词进行人工分类，并将Forbiddencity及Forbidden City、Olympic及Olympics、Tiananmen及Tiananmen等相关词汇进行合并，总计得到7个图片内容维度：人物、自然、交通、活动、建筑、文化、场所。
进一步地，通过计算机程序自动的将所有图片按照元数据中的关键词进行维度分类，得到的结果及各维度所占比例如表2所示。其中，场所、地域类（39.25%）占比最高，词频为9328次，主要为北京的区域、景点等，包括：三里屯、大山子艺术区、幸福村、凤凰城、崇文门、东直门等。活动类（16.13%）占比第二，主要包括休闲体育活动、娱乐活动等，如户外、展览、足球、游泳及锻炼，表演、绘画、展览、电影等，主要体现了北京人的生活情态，真实反映了本地居民的休闲娱乐活动和原生态的生活方式，这也印证了Goffman提出的前台、后台理论，表明游客认为市民真实的生活更具吸引力。自然类（16.11%）占比第三，与活动类差距较小，词频为3828次，主要为北京的自然景观，包含动物、植物、公园、水、石头、花、鸟等，其中，“百花山”“景山”“海淀公园”“北海公园”的排名较为靠前。人物类（13.65%）占比排在第4，词频为3245次，主要包含人物肖像、人群、儿童、美女、舞蹈者、亚洲人、唱歌者、警察等。排名后三位的分别为文化类（7.59%）、建筑类（5.33%）及交通设施类（1.95%）。文化类主要包括孔子、朝代、皇帝、佛教、陵墓及传统的中国美食等，代表了中国及老北京的特色文化，表明了北京对海外游客的主要吸引点。建筑类主要包括单体建筑及建筑相关元素，例如“鸟巢”“望京SOHO”“蓝色港湾”等为地标建筑，家具、玻璃、走廊、屋顶等为相关建筑元素，游客对北京的代表性建筑及特色建筑元素较为感兴趣，如故宫的屋檐、九龙壁、石雕等。交通设施类比重最低，一般展现为对北京车水马龙景象的全景照片，其次为机场、地铁、胡同等也取景较多。
4.2情感形象
4.2.1情感高频词
根据Russel和Pratt对目的地情感形象要素的分类及Pan对情感形容词的归类方式，对图片评论中的情感形容词进行了分类及词频比例统计，得到分析结果如表3所示，其中第三栏括号内为该词在元数据及评论中出现的次数。由结果看出，在Russel和Pratt所提及的8种情感形象特质中，由图片元数据所体现的北京情感形象包含了6种，其中，“兴奋的”（exciting）和“令人愉快的”（pleasant）代表了绝大多数读图者对北京图片的情感倾向，其次在北京相关旅游图片中还流露出“令人振奋的”（arousing）、“沮丧抑郁的”（gloomy）、“令人放松的”（relaxing）情感。其中，又以“棒极了”（great）和“美丽的”（beautiful）出现频率最高，分别为499次和386次，而出现频率最低的“美味的”（delicious）仅为2次。分析结果可以看出，海外游客对于北京图片中情感形象的整体评价以正面为主，并且情感形容词中主要以英文感叹词为主，体现了在网络评论中所具有的简短、直接、态度鲜明等语言特点。
4.2.2高频情感词对应图片内容分析
本文对图片元数据及评论中词频排名前5位的情感形容词所对应的图片内容进行了分析，以得到图片内容、拍摄视角等与情感形容词之间的联系。
（1）伟大的（grear）
图3是Flickr图片评论中含有“伟大的”（grear）的图片举例，其主要表现了对照片内容的赞叹。图片的内容以建筑、物件、场景为主，主要展现了其宏伟、壮观、气势磅礴，以及景色的辽阔、空远。图3中间图片显示了宫灯造型的奇特，让人惊叹的设计。图片总体以全景构图为主，着重突出建筑物独特的构造和物件的细节。
（2）美丽的（beautiful）
图4是Flickr图片评论中含有“美丽的”（beautiful）的图片举例，其主要表现了景色的秀丽，自然風光的美好，色彩的丰富。图片主要以美丽的风景为主，伴有屋檐、水、树叶等景观元素及色彩丰富的美食搭配，其中的建筑以特殊视角呈现，形成参差而又错落有致的表现形态，图中丰富的色彩搭配是该组图片较为突出的特点。
（3）有趣的（interesting）
图5是Flickr图片评论中含有“有趣的”（interesting）的图片举例，其以佛像、故宫、古装扮相、户外活动作为主要内容，由此可见，外国游客对中国的佛教文化、古代文化、居民的真实生活具有浓厚的兴趣。在海外游客视角下的中国传统文化折射出北京旅游形象中“有趣的”一面。
（4）令人赞叹的（awesome）
图6是Flickr图片评论中含有“令人赞叹的”（awesome）的图片举例，其整体的构图角度以全景为主，展现了城市鸟瞰、军事博物馆、特色服饰、晚霞落日、门前雄狮等内容。其中表现的事物类型多样，没有固定的内容及风格，这也符合“令人赞叹的”作为一般感叹词的基本使用场景。
（5）杰出的（excellent）
图7是Flickr图片评论中含有“杰出的”（excellent）的图片举例，其主要为对人物图片的评价，包括人物的服饰、满头皱纹的老者、热闹的市井生活、人物艺术展现形式、少数民族形象及蹒跚的老人等，图片色彩鲜明，生活风俗展现到位。热闹、放松、爱心、温暖、新颖、个性是主要展现的图片元素。集中展现了北京旅游形象中人性化、生活化和自然的一面。
5结论与展望
5.1研究结论
本文采用计算机文本分析的研究方法对基于UGC图片元数据的北京旅游形象进行了探讨，通过高频词提取、情感极性计算等技术分析了超过13000张Flickr与北京相关图片及其评论，分别获得了基于UGC图片元数据的北京旅游认知形象和情感形象。该方法与传统基于图片内容的研究方法相比，可在更大的图片樣本空间对目的的形象进行分析，在感知数据的全面性和客观性方面具有更大的优势。
本文首先将所分析的北京旅游图片以地理坐标的形式进行了可视化呈现，图片的空间分布可等同于游客游览景点的分布，由此看出游客来京所游览的地方仍然聚集在传统的北京二环老城区域内，此外，五环以内热点区域还包括：颐和园、鸟巢、大山子、三里屯、天坛，而五环外则只有长城、首都机场等少数几个区域图片相对集中。
在认知形象方面，仍然以传统著名景点为主，其中，“紫禁城”“长城”“慕田峪”“天安门广场”“颐和园”等地拍摄图片最为集中；也涉及很多与自然和社会活动相关的场景，例如“慈善挑战赛”“冒险”“自然”“植物”等。这与Flickr的主要用户来自海外有关。无论是海外游客还是常住北京的外国人，其旅游行为与兴趣爱好均通过图片内容进行了真实反映。在认知形象的维度比例中，北京旅游形象通过区域、地点所体现的吸引力仍然最大，而在区域中又以三里屯、798艺术区、大山子等传统外国人聚集区最为集中。此外，自然风景和活动类内容所占比例也较为突出，体现出北京除了悠久的历史外，优美的城市风光和现代化的都市生活场景也成为吸引游客的重要元素。故除了传统意义上的景区、景点之外，在京外国人聚集区及日常生活环境已经成为构建北京认知形象重要的载体。
在情感形象方面，北京在海外游客心目中以“令人愉快的”（pleasant）和“兴奋的”（exciting）两种情绪最为突出，所占比例分别达到57.9%和40.8%，而其中又以“伟大的”（great）、“美丽的”（beautiful）、“有趣的”（interesting）3个情感形容词出现频次最高。其中，“伟大”主要体现在建筑和历史文化方面；“美丽”则体现自然人文风貌方面；而“有趣”则通过令海外游客感到新鲜的人物、活动和文化体现。北京城市情感形象与认知形象相关，其历史、文化等方面体现的则是“伟大的”“美丽的”等意境，而现代、城市、人居等元素则激发其“有趣的”“杰出的”等情绪感受。因此，北京情感形象呈现正向且多元化的特征，由不同认知主体可以引发看图者不同的情感体验。
根据上述分析，本文建议北京旅游目的地营销从如下几方面进行改进：首先，旅游宣传力求均衡，使游客驻留区域从市区向近郊及周边区域延伸；其次，应该重视对在京长期生活的外国人及其生活区域的宣传，使其成为所在国家了解北京旅游形象的传播者，特别突出使馆区、798文化艺术区、中央商务区等区域的国际化、多元化、现代化特征，使之成为新北京城市形象的名片；再次，在情感形象方面塑造更多元化的形象，通过历史、现代、人文、市民等各方面内容组成具有包容、友善、多元的北京情感形象，而不仅仅停留在景区、标志性建筑等传统吸引物层面。
5.2未来工作
本研究区别于传统的图片内容分析方法，通过计算机程序进行了图片元数据的文本分析，在更大的样本空间对基于社交UGC图片的北京在线旅游形象进行了深入分析。然而，本研究依然具有以下局限和不足，作为未来深入研究的方向。
首先，本研究对UGC图片元数据进行了分析，解决了人工分析图片样本较少的问题，但在图片维度分类方面采用了人工的方法，具有一定的主观性，后续研究需进一步完善语料库及相关模型，提高计算机自动分析的精度及准确性；其次，对于北京旅游形象的研究目前仅限于Flickr图片网站，数据来源存在一定的局限，望在后续研究中引入更多数据作为支撑；再次，本研究对图片表征内容的分析不够深入，符号学具有较高的研究价值及研究空间，可以对图片内容进行大量专业的分析，深入了解其背后传播的情感意向及读图者眼中的北京形象认知机理。
[责任编辑：刘鲁；责任校对：周小芳]