网站首页  词典首页

请输入您要查询的论文:

 

标题 企业微博信息与短期绩效的BP神经网络预测研究
范文 刘嘉琪 齐佳音



〔摘 要〕[目的/意义]致力于更好地挖掘和利用企业微博中的信息,利用信号分析方法构建了基于企业微博的信号指标框架,为有效地预测企业短期绩效提供了新思路。[方法/过程]将该预测体系应用于典型的经验品—电影行业,经过线上收集信息、辨识信号、解读信号,最终借助BP神经网络模型输出线下首周电影票房的预测结果。[结果/结论]企业微博具有很高的探索价值,企业发布的信息性内容特征量和企业关注者的结论化反馈程度等因素对预测结果的影响较大,并且包含企业微博信号的模型预测能力得到了显著地提升。
〔关键词〕信号分析;企业微博;BP神经网络;电影票房
DOI:10.3969/j.issn.1008-0821.2018.08.010
〔中图分类号〕F062.5 〔文献标识码〕A 〔文章编号〕1008-0821(2018)08-0073-10
〔Abstract〕[Purpose/Significance]In order to discover and utilize the information in enterprise micro-blog better,this paper constructs a signal index framework based on enterprise micro-blog by means of signal analysis,providing a new way to effectively predict enterprise short-term performance.[Method/Process]Applying the prediction system to typical experience good (i.e.film) industry,the study collects information,identifies signals and interprets signal online,and finally uses BP neural network algorithm to output the prediction results of the first week movie box office revenue.[Result/Conclusion]Enterprise micro-blog has a high value for exploration,and informative content released by enterprise and followers conclusive feedbacks are proved to influence box office.Combined with the signals of enterprise micro-blog,the prediction model achieves much higher accuracy.
〔Key words〕signal analysis;enterprise micro-blog;BP neural network;box office
信息不对称是信息情报研究领域中学者们经常关注的热点。由于互动双方无法做到信息情报内容的完全共享,持有更多或更重要的私人情报的一方往往占據信息优势[1]。而信息劣势方通常会从各个方面不断地搜寻相关信息,以便于更准确地制定决策。相应地,信息优势方热衷于传递更多信息来获取劣势方的青睐,从而影响其决策行为,并从中获益[2]。随着信息时代的发展,学者们逐渐发现社交媒体中蕴含着丰富的信息资源,尤其是在用户规模最庞大的微博平台。通过对微博特征的有效捕捉可以折射出客观事物的状态和变化趋势[3],因此它成为劣势方获取信息和优势方传播信息的重要平台。
在微博信息分析研究兴起初期,Java、Asur和Bollen等学者曾利用Twitter信息进行探索性尝试,在社区结构分析、电影票房预测和股市预测方面取得了一定的成果[4-6]。虽然早期研究常集中于新闻学、传播学等领域,但随着情报学领域的信息分析方法的不断进步,从情报学角度对微博进行的研究日益增多。例如,张洋等人采用信号分析方法设计了微博信息分析系统[3],王晰巍等利用话题分析技术刻画了突发事件网络舆情态势[7],余波从竞争情报价值等方面探讨了微博信息传播意义[8]。虽然情报学领域中存在许多成熟的信息分析方法,如特尔菲法、决策树法、时间序列分析法等。但利用这些方法进行信息分析,需要大量可靠数据以做出确切判断,而微博消息则具有字符有限、碎片化的特征,这为信息分析带来了困难。不过,信号分析(Signal Analysis)恰好是一种立足于这种不完全信息条件下,针对信息不对称情景的情报分析方法。它擅长从支离破碎的“信息碎片”中去粗取精、去伪存真,抓取出对揭示客观规律有益的信号[9],因此更适合微博信息分析研究。
通过文献梳理,我们发现信号分析作为新兴领域,学者们通常将其作为分析竞争对手、规避风险、监测市场动态的工具,鲜少将其与企业市场价值相关联。同时,相关研究尚处于起步阶段,微博中蕴含的海量信息还未得到充分的开发和利用。尤其在经验品交易情景下,虽然掌握更多产品细节的企业显然是信息优势方,但学者们大多都忽略了对企业社交媒体信息和信号的分析。然而,利用情报技术,科学地遴选出关键的企业微博信号并加以有效利用,对于消费者预判产品价值和企业提升市场竞争力而言均十分有益。
因此,本研究以信号分析方法为基本手段,选取典型的经验品—电影产品为研究对象,针对企业微博的特点,以短期企业绩效预测为目标,借助BP神经网络算法构建首周电影票房预测模型。选择电影行业的原因在于:1)电影产品具有经验品消费特征,其质量具备高度不确定性和不可观测性。观众必须要在短时间内依赖外部信息制定观影决策,在此过程中有效的信号对于票房收入至关重要[10];2)电影票房数据是周期性较强的专业数据,跟踪时间较短(大约为6周[11]);3)通常企业绩效数据不够透明,普通公众和媒体很难通过大众渠道来获取。而相较之下,每个影院的电影票房数据恰好可以作为企业产品绩效的代理变量,有利于降低数据收集难度。
1 相关研究
“信号”在电子通讯、经济研究领域具有广泛应用,情报学学者对它也有着独特的理解。Fahey认为信号是个体在某种具体的环境下,对研究对象过去、当前或未来状态和行为的数据和信息进行分析而得出的结论,是信息加工后的结果[12]。沈固朝视信号分析为对事件出现的各种迹象进行解释、质疑、假设、数据补充、验证和评价的过程[13]。而刘千里等人进一步强调了信号的情报内涵,认为它本身意味着一定的不确定性,对它进行逻辑推理直至得出满足决策需要的情报为信号分析的核心[14]。许鑫等学者则将信号分析方法应用于突发事件的网络预警研究、金融风险预警研究和企业盈余预测研究中,扩展了信号分析的应用范围,为预测性研究提供了新思路[9,15-16]。
在信号搜集方面,针对电影票房预测研究场景,本文发现在早期的研究中,学者们普遍将影片自身属性视为重要的预测信号,并重点聚焦于电影产业链中的制作(如预算、导演、演员、续集、电影类型、IP版权、制片国等)、发行(如发行商资历、发行模式、发行公司的宣传支出等)和上映(如上映时长、节日假期、档期、屏幕数量、市场竞争、市场集中度等)3个阶段。数据集大多来源于早期历史数据或市场中其他类似产品的数据,然而由于产品属性和宣传策略等多方面因素存在差异,预测结果的准确度并不稳定。并且,影片在上映前并不存在票房数据,因此,首周票房预测仍是一个挑战。随着Web2.0时代的到来,与社交媒体平台信号相结合的研究逐渐成为学术热点。学者们开始利用社交网站中呈现出的用户情感倾向[5]、观影意愿[17]、影片关注程度、搜索情况[18]、口碑评价[19]、股价波动[20]等信号指标来预测电影票房。相较之下,企业微博作为低成本、实时性的企业社交媒体广告,它的内容特征为产品销售带来的贡献几乎被大多数学者们忽略了。同时,目前仍缺乏对用户线上响应行为与企业线下商业价值关系的考量。
在信号解读方面,一些学者擅长利用计量经济学模型来揭示和判断信号与电影票房间的因果关系,常见模型包括对数线性模型[21]、GMM模型[22]、Logit模型[23]、动态联立方程模型[24]、固定效应模型[25]等。然而,由于票房影响因素过于众多纷杂,依赖于事先提假设的实证研究模型的预测能力受到了很大的局限,拟合度仍有很大的提升空间[26]。同时,基于数据挖掘技术的预测研究正逐渐兴起。另一些学者们开始利用由数据驱动的自适应方法从庞大的数据中挖掘出有潜在价值信息,取代了传统计量模型事先设定假设的步骤,从而可以更灵活地寻找数据之间的客观规律[27]。常见的数据挖掘算法包括神经网络[28]、支持向量机[29]、决策树模型[30]、贝叶斯网络和狄利克雷分布等算法[31]。其中,神经网络算法受到学者们广泛地认可,由于其具有良好的自学习和联想储存功能,能够高速寻找优化解,有效提高了需求预测准确率。
因此,本研究将借助BP神经网络模型对多维度下的企业微博信号的重要程度进行评估,从而预测出电影首周票房收入,进一步拓展信号分析和电影票房预测研究体系。
2 信息收集
针对所研究的具体问题,本文首先明确了需收集的企业微博信号范围和信息数据来源。
2.1 信号选擇范围
2.1.1 企业微博范畴——企业创作内容特征
企业创作内容作为企业在社交媒体中正式地、官方地生产的网络内容[32],已逐渐成为企业推介产品、客户关系管理、传播品牌和危机公关等的重要方式[33],同时也为消费者提供了近距离接触信息优势方的最直接渠道。捕捉企业创作内容中呈现的关键信息,有利于深化消费者对产品的认知和理解。参考Nelson在营销学领域提出的经典广告分类方法,将企业创作内容特征分为两大类,信息性特征和说服性特征[34]。
信息性特征,明确地告知消费者产品的存在、价格和物质形态等与产品相关的特征[35],目的在于降低消费者的搜寻成本[36]和决策风险[37]。甚至可以在消费者做出购买决策之前,通过传递可靠的信号使经验品变成搜寻品[38]。
说服性特征,为企业和品牌创造、培养了一定特色,塑造了独特的市场形象,满足目标消费者的某种偏爱和情感需求[39-40]。它虽然往往与具体的产品或服务本身无关,但对于无法准确地用信息性内容描述质量的经验品十分重要。它擅长利用友善的、有趣的、感性的、高互动的沟通手段与信号接收者建立亲密的、长久的良性关系,使得用户不仅把企业视为追求利润的经济实体的代言人,同时也是具有感情和沟通能力的人格化角色,拉近企业与用户间的距离,提升了用户对企业的好感和青睐,从而将企业产品自然纳入商品备择集中,因此是对潜在消费者心智方面的长期投资。另一方面,它通过向消费者表明企业有实力投资于非信息性广告,鼓励消费者对该信号进行简单的联想和推断,使其间接相信产品具有高质量,可以通过高销量抵消广告方面的支出[35]。
因此,企业创作内容的信息性特征和说服性特征均可作为企业在微博平台发布的信号,为消费者提供推断产品真实价值的途径。
2.1.2 企业微博范畴——企业微博发布策略
在信息稀缺的情景下,信息长度经常作为内容深度的度量指标,并被证实与内容的有用性正向相关[41]。相似地,企业发布的信息越长,每条信号传递出的有效内容越多,可被消费者参考的线索越丰富,能更好地评估产品细节提供帮助[42]。
同时,企业发布信息的频率可以反映出影片的宣传力度和受重视程度。在一定时间范围内,用户接收信号的数量越多,其工作记忆越深刻,认知程度越高。频繁的强信号刺激可能会积极地促进消费者的购买决策行为,因此,本研究从企业创作内容的发布策略视角出发,视信息平均长度和信息发布密度为对预测产品销量有益的信号。
2.1.3 企业微博范畴——企业关注者响应程度
对于不了解产品的潜在消费者而言,其他关注者对企业微博的反馈同样也可作为重要信号辅助其决策。
在企业发布微博后,粉丝的转发行为能够有效帮助企业在社会网络中扩散信息,令消息跨越社交网络结构中的稀疏区域,使信息抵达更广泛的人群。一方面,消费者的购买行为是从对商品的认知开始的[43],该举动使得企业创作内容呈现在更多用户视野中,有效地提升产品的曝光度,使得产品进入更多消费者的备择集合中。另一方面,用户自愿地在个人主页宣传企业的商业信息,表明了对产品最大程度的认可和满意[44]。此时,不仅转发者本身有更高概率选择该产品,而且由于关注者和被关注之间常常是朋友关系或其他具有较高信任的关系(如名人与粉丝),这种认可和满意会被信号的下级接收者感受到,加深其记忆、思维和联想,最终帮助企业在商品销售中获得更高的销量。
同时,用户的评论行为可作为企业与消费者双向沟通关系成立的信号,而点赞行为直接体现了用户对企业的支持态度和好感。当消费者制定购买决策时,更倾向于选择形象亲切、口碑良好、值得信赖的企业和产品,即使市场上可能同时存在其他替代产品。因此,企业创作内容收获更多的评论和点赞数量有利于企业进一步提升商品的销量。
于是,本研究将社交网络中关注者整体的响应程度(即转发、评论和点赞量)作为一种信号,认为其对电影线下的票房收入产生影响。
2.1.4 其他范畴信号
许多研究发现,对于难以准确描述细节的经验品而言,仅凭借企业主动发布的信号可能无法全面地预测其价值。而产品特征和市场竞争环境信息[56]也会向消费者传递一定的可供联想和推断的线索[45]。同时,由于本文重点对上映后的首周数据进行预测,因此排除了在电影上映前属性未知的指标。最终在电影产品特征层面选取了评分、出品国、类别、导演和IP版权信号,在市场竞争环境层面选取了上映日特殊性和市场竞争水平信号。
评分。在电影市场中,有些已消费的用户或机构依据亲身经验对产品质量的优劣进行评价,这些最直接的反馈为潜在消费者提供了重要信号[31]。发达的社交网络也促使观影口碑成为影响票房的因素之一,但对于评论内容而言,非结构化数据的准确处理相对困难,而评分可以认为是主流口碑的简单化呈现,能够代表大部分评论的情感倾向[23]。因此,我们将选取社交网络中的影评分数作为用户口碑的整体评价。
出品国。由于院线每年合法引进的电影数量仅有60部左右,出于商业目的,院线往往选择引进大制作商业片,而观众往往因为精良质量和演员阵容选择观看进口大片,因而进口电影与国产电影表现出明显的票房差别。
影片类型。不同电影天然上就有不同的受众群,部分类型的影片会比其他类型的影片票房更高。例如Dellarocas指出冒险/动作类影片的票房显著高于其他类型影片[46]。因此,我们单独对冒险类和动作类电影进行计算。
导演影响力。导演的能力大小往往决定了一部电影的内涵与层次,甚至在很大程度上影响着最终的票房收入[30]。由于每位导演所导演的影片数目不同,我们利用艺恩网对于导演执导的电影数据进行统计,选取的是导演所执导的最近5部电影票房表现的平均值。
IP(Intellectual Property,知识产权)版权。IP为可以改编为电影的作品,包括文学作品、戏剧、故事大纲、故事梗概和原创剧本等[47]。在當下的文化消费市场,可被翻拍为电影的IP原著往往已经具备了一定的粉丝群体、较高的影响力与成功的口碑,消费者对于原IP的支持态度可能会影响其对影片的判断[21]。因此我们认为“是否由IP作品改编”可作为预测电影质量的信号,影响着票房的走向。
上映日特殊性。经诸多研究发现,虽然特殊的上映日期会提升产品间的竞争,但也会为电影票房带来额外的收入,如周末、公共假日、特殊节日等。本文重点识别出贺岁档(指从11月20日左右开始直到春节长假结束,以影片大规模上映为开端)、暑期档(指每年6月1日至8月31日的时段内,主要受众为4~24岁的学生观众)、国庆档(指每年国庆节7天长假期间)、特殊节日(包括情人节、圣诞节、光棍节、520等)和周末(即星期六与星期日)。
市场竞争水平。由于影片生命周期的短暂性,同期上映的影片之间具有较强的竞争关系,这种市场竞争水平也会影响消费者的注意力和决策结果,从而影响院线从该影片获得的票房收入。本研究统计每部影片前后2周时间内上映的影片数量(包括该影片自身)作为对电影市场竞争水平信号的测量。
2.2 信息数据来源
以新浪微博作为微博研究平台,选取中国最大的电影院线企业——万达院线作为研究对象。万达院线已连续8年在票房、观影人次、市场份额等方面位居国内首位,以代表性的领先企业作为样本,不仅可以消除由行业竞争对模型带来的影响,还可使研究发现具有“对总体的外部效度”的概率更高[48]。
爬取以下几部分数据:企业微博维度:1)万达院线在新浪微博(www.weibo.com)中注册的官方账号“万达电影生活”从2014年12月至2015年12月期间发布的所有企业创作内容数据,共计1 584条;2)与企业创作内容对应的用户响应结果数据(包含评论、转发、点赞),共计637 046条。其他维度:1)2014年12月至2015年12月期间,中国万达院线(www.wandafilm.com)上映电影的每日票房数据,共计294部影片;2)每部影片在豆瓣电影社区(www.douban.com)中的评分、类别、导演、简介等信息;3)从艺恩网(www.entgroup.cn)获取影片导演近5年拍摄作品的票房收入。
获取数据后,对其进行初步清洗处理,将不完整的、有噪声的和不一致的脏数据清除。并在初步规范化数据格式后,将数据由多源合并成一致的数据存储,形成了最终的完整数据集。
3 信号辨识
信号辨识是对收集到的不完全的、离散、模糊的信息进行整理,确定合适的分析维度和用以衡量信号强度的指标体系,量化信息和数据。由于数据集主要由结构化数据和非结构化文本内容构成,对其处理主要分为以下过程:
3.1 文本内容特征解构
对企业创作内容特征的辨识采用内容分析法,即一种将不系统的、定性的符号性内容,如文字、图像转化成系统的、定量的数据资料的研究方法,具体识别标准见表1。在处理企业创作内容特征的影片归属问题时,信息性特征起到了关键作用。而在缺乏信息性特征的企业创作内容中,说服性特征与具体影片无明显关联,较难判断。鉴于电影上映前后1周为电影主要的宣传期,因此,我们通过判断发布时间是否属于某部电影上映前后7天(共14天)的时间窗口,来对其进行指定计算。若企业创作内容同时属于多部电影的窗口期,则分别进行计算。
3.2 信号强度测量
本研究的输出预测变量为电影首周票房收入,输入信号共15个,具体测量方式及描述性统计,见表2。
式中:InfoFeaturemi为与第m部电影相关的第i个信息性特征数量,PersFeaturemj为与第m部电影相关的第j个说服性特征数量。RepostVolw、CommentVolw、LikeVolw分别表示微博w的转发、评论和点赞量,Trepost、Tcomment和Tlike分别表示转发、评论和点赞行为的发生时间。DirectorBoxOfficemn为第m部电影的导演最近指导的第n部影片所收获的电影票房。WandaBoxOffice为万达影院每日票房。
3.3 输入变量预处理
由于不同信号数据有着不同的取值范围,为消除不同量纲数据对预测效果的影响,我们对各输入指标进行归一化处理,以便后续进行BP神经网络模型构建[49],即将数值限定在[0,1]区间内,归一化公式为:
4 信号解读
信号解读是通过对经过辨识阶段量化的信号进行多方面的揭示和判断,从而获取对预测有价值的结论。本研究主要借助BP神经网络模型分析收集到的信号。
4.1 相关性分析
为避免各输入因素间相互干扰,对其进行相关性分析,探索各因素间依存关系,见表3。各因素间相关系数均小于0.7,故不用删去任何指标。
4.2 BP神经网络构建
BP神经网络是基于BP算法的多层前馈网络,其算法成熟,网络结构简单,具备较强的非线性映射能力的突出特点,已成为目前应用最广泛的神经网络模型之一[50-51]。传统的BP算法是基于最小二乘法(OLS)思想的一种有监督的学习算法,目的在于求解误差函数的最小值。学习过程由信号的正向传播与误差的逆向传播两个过程构成。正向传播时,模式作用于输入层,经隐含层处理后,传向输出层。对于输出层的输出值,如果不是预期中的期望值,则会反向的对网络不断地进行修正,逐层修正各个连接的权值,并完成误差的修正过程。通过不停地修正,最后准确率也不断提高,直到达到期望值所在范围或达到设定的学习次数才终止学习。权值不断修改的过程,也就是神经网络的学习过程,具体流程图见图1。
图1 BP神经网络学习流程图
4.2.1 确定网络结构
网络层数:BP网络一般由1个输入层,1个输出层及若干隐含层构成。实际应用中,对于电影票房的预测,通常利用1个隐含层就基本上能满足问题的需求[50]。虽然增加隐含层数可以提高预测精度,但盲目地增加隐含层层數,往往会使学习速度变慢,同时增加了结构的复杂性。因此,我们选择1个隐含层。
输入层节点数:输入层节点数由影响输出变量的输入变量个数来决定,节点过少使得网络不能很好地获得输入与输出数据的非线性关系,如果过多则会增加过拟合的危险。本研究共有15个变量,故输入层节点选为15个。
输出层节点数:输出层节点数取决于输出数据类型和表示该类型所需的具体数据。本研究的输出层包含1个节点,为电影首周票房收入值。
隐含层节点数:对于输入与输出均为有限个数的神经网络,隐含层节点数的选择原则是保证预测精度的情况下选择尽量少的节点数[51],过多的隐含层节点数会导致学习时间过长,但隐含层节点数太少则使得容错性差,对未经学习的样本识别能力大大降低,所以必须综合多方面的因素进行设计。本研究依据张向宁和黄章树提出的经验公式计算隐含层的神经元初始值,计算结果约为7[52]。最终,确定BP神经网络模型图,见图1。
l=(0.43m·n+0.12n2+2.54m+0.77n+0.86
式中:m、n分别为输入层结点数与输出层结点数,l为隐含层节点数。
4.2.2 实验参数设置
本文选用Clementine12.0软件来实现BP网络学习过程,Clementine工具箱不但支持整个数据挖掘流程(包括从数据获取、转化、建模、评估到最终部署的全部过程),而且包含丰富有效的模型算法,使得BP网络的建立、训练以及预测更具可靠性和精确性。同时,训练过程非常直观,令神经网络模型具备高实践性。
隐含层部分采用S(Sigmoid)函数(即S(t)=11+e-t,式中t为上层组合函数的结果)为传递函数,输出层传递函数采用线形传递函数。允许误差设定为0.01,学习速率选定0.01,最大迭代次数为3 000次,动量参数使用0.8。
为了得到相对准确的误差估计,尽量避免过拟合,本研究建立Partition节点,并连接到数据流上的超节点上,随机选取50%为训练样本集,50%作为检验样本集。
4.3 信号敏感度分析
输出变量是数值型变量,预测精度的方法为:R=1-Yi-Y′iYmax-Ymin(式中,Yi-Y′i表示第i个样本实际值与模型预测值的误差绝对值;Ymax为最大输出变量的实际值,Ymin为最小输出变量的实际值)。经过训练,神经网络的预测精度R为0.95158,结果比较理想。
由于各层节点间通过权值交错相连,无法直接观测到各输入信号对输出变量的影响程度。因此,我们基于不同的输入变量取值对输出变量的改变程度而进行敏感度分析,通过敏感度的大小反映各信号对预测变量的影响程度[53],分析结果见图3。
对票房影响最大的信号为企业微博中的企业创作内容信息性特征,说明企业传递与产品紧密相关的信号越多,对消费者影响越大,对电影票房的干预作用越显著。同时,相比于评论,点赞与转发量体现出更高的影响力。原因在于社交媒体作为一个利用碎片化时间向消费者传递信号的平台,信息的理解成本越低,对消费者的影响价值越大。点赞和转发量可以直观地传递出用户整体的好感和支持程度。而评论则需要用户额外付出认知、心智和时间成本来判别观点的情感倾向,其数量无法直接表达消费者的意向和态度结论,因此无法作为有效信号。
另外,在其他信号中,影片评分作为结论化的口碑倾向,较直接地降低了消费者的不确定性,益于其制定购买决策。相比于冒险类影片,动作类影片对消费者产生更高的吸引力。导演作为影片最核心的创作人员,掌握着影片艺术创意的领导权,其职能不仅局限于审美范畴,还影响着投资立项、资金调度、演员任用等工作。因此,导演的影响力可以较准确地反映出影片的制片水准和审美层次,具有高影响力的导演所指导的电影作品很大程度上会相应的产生较高的市场价值。市场竞争水平对电影首周票房收入也有较强影响,在消费者对产品质量并不完全了解时,积极参与竞争的影片可以成功地传递出其对高质量产品充满信心的可靠信号,吸引消费者做出购买决策。
相较之下,评论数量和冒险类影片的敏感度低于0.01,对电影票房预测的贡献度较低。
4.4 预测结果稳健性分析
首先,为了验证企业微博维度中最重要信号的稳健性,我们将输入变量作为自变量,将输出变量作为因变量,利用计量经济学中的多元OLS回归方法对电影首周票房收入的影响因素进行分析。发现模型拟合度为0.523,低于BP神经网络模型。在较高的显著性水平(P=0.000)下,企业创作内容的信息性特征内容仍为对电影首周票房影响最大的因素(未标准化系数为15 722.123,标准误为1 635.312),证实了该信号对于电影票房的预测而言至关重要。
其次,对BP神经网络模型的预测效力进行检验。我们采用交叉验证法对神经网络模型和回归模型的预测精确度做了比较[27]。具体地,我们随机地将样本数据分成了4个不同子集,即每个子集包含有71部电影,每个子集轮流被用作测试样本。当其中某一子集作为测试样本时,其余子集则为训练样本,每一次测试都会得到输出变量的预测值,将其与电影票房的真实值进行比较,便可计算出其平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)。计算公式为:
按照此步骤分别对两类模型进行测试,最终得出MAPE值,见表4。发现BP神经网络模型的MAPE值均小于回归模型,代表神经网络预测模型在本研究情景下,面向电影票房预测问题具有更优的解决效果。
最后,横向地与类似研究结果进行比较,王炼等基于网络搜索的票房预测模型MAPE为0.399[18];Ainslie等学者构建的电影生命周期预测模型MAPE为0.387[54];Liu在考虑口碑对票房的影响后,电影首周票房预测模型MAPE为0.387,电影总体票房预测模型MAPE为0.47[55]。参照其他研究,发现以信号分析方法为工具,纳入了企业微博信号指标的预测模型具有较高的预测价值。
5 结 语
本文以电影行业为例,基于企业微博信息,创新性地将信号分析方法的基本原理与BP神经网络模型相结合,对企业短期绩效进行成功地预测,在提升预测准确率方面取得了良好效果。实验结果表明,企业微博信息与电影票房变化有很高的相关性,企业发布的与产品紧密相关的信息性内容特征数量及以转发量与点赞量呈现出的结论化用户响应程度,作为有效信号,对电影首周票房收入预测具有很好的指示作用。同时依据其他信号与输出变量的敏感度分析,发现水平较高的导演、合适的上映时机、受欢迎的影片类型也是传递电影市场价值信息的重要信号。
在理论层面,本文实现了:1)在信息情报学领域,基于信号分析视角甄选出预测能力较强的指示信号,证实了企业微博的高利用价值。发现企业社交媒体参与工作、其他关注者的社交媒体响应、影片自身质量和市场竞争水平对票房预测具有一定的影响作用;2)在企业营销领域,创新地将企业社交媒体营销内容与市场绩效相结合,跳脱出目前学术界单纯以虚拟用户卷入结果来衡量企业社交媒体营销效果的研究格局,为评估企业线上营销工作价值提供了真实的物质基础和客观量化条件;3)在票房预测领域,预测结果显示相比于其他类似研究,基于BP神经网络和微博信号的预测模型能够提高票房预测的准确性。
在实践层面,得到了以下启示:1)在社会化营销工作方面,企业可适当地增加信息性内容在企业创作内容中的比重,因为当消费者接收到高质量的有用信号后,会树立起对企业和产品更深层次的认知,降低了决策风险和不确定性,推动了双方在商业交易中达成共识,从而提升了产品销量和企业收入。2)在提升社交网络中其他用户的参考价值方面,相较于精细地阅读和判断其他用户的评论内容,消费者更需要能迅速识别影片质量、降低理解成本、有助于决策的简单信号。因此,网站运营者应重点呈现那些经过统计处理的关于影片质量的结论化信息(如网络口碑评分、转发量和点赞量),而企业应将提升其分数和数量作为社交媒体营销活动的重点任务。3)在电影筹备方面,制片方应着重考虑導演的影响力,选取高票房导演增大了影片成功的概率。4)在电影放映方面,选择在多部影片云集的高竞争档期上映,既向消费者传递出质量可靠的信号,也可激发出观影者的猎奇心理,有助于吸纳更多票房。
本文仍存在不足之处。1)仅重点关注与短期营销收入相关的企业微博信号,未来应进一步广泛考察各方面信号对于企业整体市场价值的影响。2)仅单独调查了一个行业和业内的领先企业,整体数据量不算庞大,部分变量的缺失也可能对模型预测的结果造成影响,未来考虑将基于信号分析理论的研究扩展到更多企业和行业。
参考文献
[1]Aaker D A,Keller K L.Consumer Evaluations of Brand Extensions[J].Journal of Marketing,1990,54(1):27-41.
[2]Connelly B L,Certo S T,Ireland R D,et al.Signaling Theory:A Review and Assessment[J].Journal of Management,2011,37(1):39-67.
[3]张洋,张津华,谢齐.基于信号分析方法的微博信息分析系统设计与实现[J].情报理论与实践,2013,36(5):104-110.
[4]Java A,Song X,Finin T,et al.Why We Twitter:An Analysis of a Microblogging Community[M]//Advances in Web Mining and Web Usage Analysis.DBLP,2009:118-138.
[5]Asur S,Huberman B.Predicting the Future with Social Media[J].Social Science Electronic Publishing,2010,7(2):492-499.
[6]Bollen J,Mao H,Zeng X.Twitter Mood Predicts the Stock Market[J].Journal of Computational Science,2011,2(1):1-8.
[7]王晰巍,邢云菲,王楠阿雪,等.新媒体环境下突发事件网络舆情信息传播及实证研究——以新浪微博“南海仲裁案”话题为例[J].情报理论与实践,2017,40(9):1-7.
[8]余波.微博的情报学意义探讨[J].图书情报工作,2010,54(22):57-60.
[9]许鑫,张岚岚.突发事件网络舆情预警模式探索[J].图书情报工作,2010,54(22):135-138.
[10]Moorthy S.Can Brand Extension Signal Product Quality?[J].Marketing Science,2012,31(5):756-770.
[11]Elberse A,Eliashberg J.Demand and Supply Dynamics for Sequentially Released Products in International Markets:The Case of Motion Pictures[J].Marketing Science,2003,22(3):329-354.
[12]利亚姆·费伊.竞争者:以才智、谋略与绩效制胜[M].北京:中国人民大学出版社,2005.
[13]沈固朝.信号分析:竞争情报研究的又一重要课题[J].图书情报工作,2009,53(20):11-14.
[14]刘千里,童悦.信号分析的若干理论与方法探析[J].图书情报工作,2009,53(20):15-19.
[15]杨雪莱,许传华.中国金融风险预警指标的最优阈值及预测绩效分析[J].金融经济学研究,2012,(2):121-128.
[16]王雄元,彭旋.稳定客户提高了分析师对企业盈余预测的准确性吗?[J].金融研究,2016,(5):156-172.
[17]Shugan S,Swait J.Enabling Movie Design and Cumulative Box Office Predictions Using Historical Data and Consumer Intent-to-View[J].University of Florida,2009.
[18]王炼,贾建民.基于网络搜索的票房预测模型——来自中国电影市场的证据[J].系统工程理论与实践,2014,34(12):3079-3090.
[19]Duan W,Gu B,Whinston A B.Do Online Reviews Matter?——An Empirical Investigation of Panel Data[J].Decision Support Systems,2008,45(4):1007-1016.
[20]Spann M,Ernst H,Skiera B,et al.Identification of Lead Users for Consumer Products Via Virtual Stock Markets[J].Journal of Product Innovation Management,2009,26(3):322-335.
[21]侯永,王铁男,李向阳.质量信号的连续传递性——电影市场质量信号的影响边界[J].宁夏大学学报:人文社会科学版,2014,36(4):133-140.
[22]罗晓芃,齐佳音,田春华.电影首映日后票房预测模型研究[J].统计与信息论坛,2016,(11):94-102.
[23]王錚,许敏.电影票房的影响因素分析基于——Logit 模型的研究[J].经济问题探索,2013,(11):96-102.
[24]Elberse A,Eliashberg J.Demand and Supply Dynamics for Sequentially Released Products in International Markets:The Case of Motion Pictures[J].Marketing Science,2003,22(3):329-354.
[25]夏妮亚,蒲勇健.基于多国面板数据的电影产业经济特征分析与国内电影票房影响因素研究[J].经济问题探索,2012,(6):136-144.
[26]严建援,张丽,张蕾.电子商务中在线评论内容对评论有用性影响的实证研究[J].情报科学,2012,30(5):713-719.
[27]赵丽娜,韩冬梅.基于BP神经网络的在线评论效用影响因素研究[J].情报科学,2015,33(6):138-142.
[28]连聪聪,杜仪,张辉.基于电影营销因素分析的电影票房预测[J].中国传媒大学学报:自然科学版,2015,22(4):26-30.
[29]王晓耘,袁媛,史玲玲.基于微博的电影首映周票房预测建模[J].现代图书情报技术,2016,32(4):31-39.
[30]王玉帛.基于数据挖掘对影响电影票房因素的浅析[J].通讯世界,2017,(2):236-237.
[31]Eliashberg J,Elberse A,Leenders M A A M.The Motion Picture Industry:Critical Issues in Practice,Current Research,and New Research Directions[J].Marketing Science,2006,25(6):638-661.
[32]Qu Q X,Qi J,Tan Y.User-Generated Content(UGC)Encountered Enterprise-Generated Content(EGC):Quantifying the Impact of EGC on the Propagation of Negative UGC[C]//PACIS,2014:88.
[33]王战平,阮成奇,李鸣瑜,等.企业微博传播效果测评研究[J].情报科学,2014,32(9):52-59.
[34]Nelson P.Information and Consumer Behavior[J].Journal of Political Economy,1970,78(2):311-329.
[35]Milgrom P,Roberts J.Price and Advertising Signals of Product Quality[J].Journal of Political Economy,1986,94(4):796-821.
[36]Stigler G J.The Economics of Information[M].Belknap Press of Harvard University Press,1984.
[37]Bettman J R,Park C W.Effects of Prior Knowledge and Experience and Phase of the Choice Process on Consumer Decision Processes:A Protocol Analysis[J].Journal of Consumer Research,1980,7(3):234-248.
[38]Klein L R.Evaluating the Potential of Interactive Media through a New Lens:Search Versus Experience Goods[J].Journal of Business Research,1998,41(3):195-203.
[39]Nelson P.Advertising as Information[J].Journal of Political Economy,1974,82(4):729-754.
[40]Goldman R,Papson S.Sign Wars:The Cluttered Landscape of Advertising[M].Guilford Press,1996.
[41]Mudambi S M,Schuff D.What Makes a Helpful Review?A Study of Customer Reviews on Amazon.com[J].2010.
[42]曾伟.基于ELM的在线评论有用性研究——商品类型的调节影响[J].现代情报,2014,34(12):148-153.
[43]蔡佩儿,沙振权.互联网视频贴片广告下的品牌说服效果[J].管理学报,2016,(10):1525-1533.
[44]Chung S,Animesh A,Han K,et al.Firms Social Media Efforts,Consumer Behavior,and Firm Performance[J].2014.
[45]Balachander S,Sanjoy G.Reciprocal Spillover Effects:A Strategic Benefit of Brand Extensions[ J ].Journal of Marketing,2003,67(1):4-13.
[46]Dellarocas C,Zhang X M,Awad N F.Exploring the Value of Online Product Reviews in Forecasting Sales:The Case of Motion Pictures[J].Journal of Interactive Marketing,2007,21(4):23-45.
[47]李宏宇.“IP”改编电影与其市场表现分析[J].中国电影市场,2016,(12):31-34.
[48]傅慧芬,赖元薇.消费电子品品牌社交媒体内容营销策略研究——基于联想、华为、HTC和三星微信公众号的内容分析[J].管理评论,2016,28(10):259-272.
[49]付斌,张吉军,钟健,等.基于BP神经网络的数据挖掘方法在需求预测中的应用研究[J].情报科学,2017,35(11):132-135.
[50]周朴雄,张兵荣,赵龙文.基于BP神经网络的情境化信息推荐服务研究[J].情报科学,2016,34(3):71-75.
[51]丁筠.学术期刊影响力指数(CI)预测模型的构建[J].情报科学,2017,35(2):27-32.
[52]张向宁,黄章树.基于BP神经网络的CPI 预测研究[J].商情,2007,(2):104.
[53]袁海霞.网络口碑的跨平台分布与在线销售——基于BP人工神经网络的信息熵与网络意见领袖敏感性分析[J].经济管理,2015,(10):86-95.
[54]Ainslie A,Drèze X,Zufryden F.Modeling Movie Life Cycles and Market Share[J].Marketing Science,2005,24(3):508-517.
[55]Liu Y.Word of Mouth for Movies:Its Dynamics and Impact on Box Office Revenue[J].Journal of Marketing,2006,70(3):74-89.
[56]彭靖里,可星,李建平.企業技术竞争情报中的市场信号分析及实证研究[J].情报理论与实践,2016,39(1):82-87.
(责任编辑:孙国雷)
随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/17 9:15:13