标题 | 社会媒体中情绪因素对用户转发行为影响的实证研究 |
范文 | 丁绪武 吴忠 夏志杰 [摘要]为了研究微博中情绪因素对用户转发行为的影响,构建了情绪因素对转发行为影响的假设,并建立了相关的回归方程,最后以“马航飞机失踪”和“李某某案件”两个微博热门话题作为研究样本集,利用负二项回归分析进行了假设检验,结果表明:相比于中立性的微博,带有情绪色彩的微博更容易得到转发和传播,并且情绪对于微博的转发数量和转发速度都有积极的影响。 [关键词]社会媒体;情绪;转发;新浪微博 [中图分类号]TF273 [文献标识码]A [文章编号]1008-0821(2014)11-0147-09 近几年,社会媒体取得了巨大的发展,它对于传统的沟通模式以及信息传播方式产生了重要影响。以Faeebook为例,截止到2012年12月,其用户数量已经超过了10亿,与此同时,Twitter覆盖人数也达到了2亿。在国内,新浪微博(以下简称微博)作为社会媒体的领跑者,其用户数量也超过了2.8亿。如今,随着互联网的广泛普及以及其基础设施和技术手段的不断进步,以往限制网络信息扩散的瓶颈已被消除,蕴涵大量UGC的社会媒体平台正在改变着信息传播和扩散的方式。 社会媒体促进了社会网络中的转发分享行为。一些学者通过研究总结出几种影响社会媒体信息扩散的因素:内容相关功能(例如主题、URL和标签云、用户及网络特性(社会资本认知、声望和同质性)。社会媒体在实现关键信息的流动和共享,以达到提高应急管理决策制定的效率方面也发挥着重要作用。然而,很少有研究将情绪作为一种潜在的驱动因素来解释社会媒体中信息扩散的动机,尤其是针对社会媒体用户的分享行为。作为人与人沟通的一部分,社会媒体中的内容包含了作者的情感、其对一个人、事件或者主题的主观判断,我们将这些通通定义为情绪。 鉴于对于情绪方面的研究一般都是从心理学角度出发,本研究希望借鉴这些研究成果,填补社会媒体中情绪表达和转发行为两者潜在关系这一项空白。更进一步地说,本研究假设社会媒体中情绪的扩散对于用户的转发行为有着积极的影响,该假设的建立是基于先前不同学科的研究成果。文献研究表明具有影响力的信息能够在电子沟通媒介中进行传播,文献通过对社交网络、博客、在线新闻门户网站等研究发现,消息的情感维度能够引发更多的认知性涉入,例如关注、高效的激励,这些认知性涉入反过来会影响社会媒体的参与度与用户的转发行为。 本研究选取了微博中两个相对热点的社会话题作为研究的对象,之所以选择此类话题是因为其相比于娱乐类、体育类等话题,更加具有争议性和两极分化性,网友对其评论带有更多的个人见解和情绪。而将微博作为数据的来源主要是因为其庞大的用户基数以及良好的信息扩散与分享机制。微博作为一个理想的信息传播平台,其传播机制首先由某个用户产生一条少于140个字的微博,然后此微博会被对其感兴趣的粉丝进行转发,粉丝在转发的过程中可能会加入自己的观点。 鉴于社会媒体中情绪扩散对用户转发行为影响研究的缺乏,首先提出情绪扩散对转发行为的影响假设,然后通过实证研究进行验证,进一步挖掘社会媒体中情绪扩散对用户转发行为影响的潜在因素,为准确地描述情绪在社会媒体转发行为中的角色提供依据和支持。 1、文献回顾 1.1 情绪对信息分享行为的影响 学者们已经证明一般情绪性需求非常具有说服力和感染力。正如Forgas所说,情绪会影响我们所关注的事物、我们所学习的东西、我们所记忆的过往,最终会影响我们的判断和决定。以书面交流为例,先前的研究指出带有情绪性的词语或者能够引起广泛认知的信息都能够产生“情绪刺激(emotional stimuli)”。认知参与水平的提升可能反过来导致更高的可能性去对“情绪刺激”做出回应,例如信息分享等。同样的,情绪的扩散可能反过来通过信息协调(information eoordlnation)和分享(sharing)来影响个人或者群体之间的交流。 除了高水平的认知参与,几种确定的情绪例如生气(anger)、焦虑(anxiety)、敬畏(awe)和消遣(amusement)也能够引发人们对某件事情或者某个话题做出强烈的回应,我们可以将上述这些情绪统称为生理冲动(physiologicalarousal)。生理冲动已经被证实是驱动信息分享行为的一个重要因素。而在社会媒体中,这种生理冲动可能导致的后果是其产生的信息是具有病毒性的,相比于不带情感色彩的信息,这种更容易得到广泛的传播和分享。 因此,从前人的研究中可以总结出,认知参与过程和情绪刺激在传统的书面交流和口头交流中对于信息的传播和转发行为起着决定性的作用。 1.2 网络沟通中的情绪 先前的研究已经指出了网络沟通(computer-mediatedcommunication,也叫电脑中介传播)在传播有关情绪性信息的作用。在网络沟通中,情绪对于接收者处理和解读信息具有显著影响。Harris和Paradliee研究表明,在网络沟通中,信息接收者能够通过一些带有情绪的词汇以及辅助语言的工具(如表情符号等)来理解发送者的情绪。事实上,大量的相关工作已经揭示了在网络沟通和在线交流中情绪的作用。如Huffaker研究在线论坛时发现,那些在消息中利用更多情感语言(包括积极的和消极的)的人比不这样做的更能收到更多的反馈。在一个有关于新闻组的研究中,Joyee和Krant发现积极的讯息能够加固一个社区的粘度并吸引更多的人参与,而消极的讯息则恰恰起到相反的作用。其他一些研究发现,在一些社会媒体中,例如SNS、博客和在线论坛等,情绪可以通过回复、跟帖等形式来进行扩散。Berger和Milknlan在对纽约时报近三个月内的全部文章研究发现,文章被分享的可能性不仅是因为其所蕴含的积极情绪,也有可能是其他一些能够引起生理冲动的情绪。 以上述研究为基础,可以认为由情绪引发的认知和情感激励以及分享行为同样可以应用到社会媒体的研究领域。尤其值得我们注意的是,社会媒体中文本描述所流露出的情绪更能得到关注,这也同样地会刺激信息的转发和分享。以上这些理论基础使得我们推测在微博中同样具有类似的特征。 2、研究假设 如今互联网蕴含的信息呈爆炸式的增长以及社会媒体的飞速发展,这些因素都促使虚拟的社会网络中出现了越来越多的信息分享行为。在社会媒体中,信息的扩散是以一个用户或者一个社区为中心呈点状式的向周围进行传播,在六度分隔理论的驱使下,信息的传播范围往往会超出最初发送者的预料。尤其是对于微博来说,其具备的转发功能使得这种现象更为明显。在信息传播的驱动因素中,情绪的扩散无疑起着关键的作用。情绪的扩散对于用户分享行为的影响也是多方面的,但是究其本质,本文发现其主要是从转发(分享)的数量和速度两方面来影响分享行为。因此本研究有如下假设: H1:一条微博中蕴含越多情绪性因素,其越容易被转发(分享); H2:一条微博中蕴含越多情绪性因素,其距第一次转发(分享)的时间越短。 前人关于心理学和组织行为学的研究已经表明,人们对于积极和消极的刺激所做出的反应是不同的。相比较来说,消极刺激能够更加强烈地、快速地引发人们在情感上和行为上的认知。更确切地说,人对于那些消极的或者说是负面的情绪或刺激具有一种先天性的倾向,这种现象称为消极偏见(negativity bias)。最近关于Facebook的相关研究也表明相比于积极情绪,含有较多消极情绪的状态能够得到更多的回复。基于以上的研究成果,本研究有如下假设: H3:一条含有较多消极情绪因素的微博,相比于含有较多积极情绪因素(以及中立性)的微博,其转发的次数更多; H4:一条含有较多消极情绪因素的微博,相比于含有较多积极情绪因素(以及中立性)的微博,其距离第一次转发的时间更短。 3、数据收集与方法设计 3.1 数据采集 研究以新浪微博为研究对象,通过其开放的API接口获取了关于“马航飞机失踪”和“李某某案件”相关微博。然后对获取到的微博样本进行修整和处理,剔除了一些内容关联度不高的样本,最终分别获得了62 133条关于“马航飞机失踪”的微博以及103 267条关于“李某某案件”的微博。 3.2 情绪分析 情绪分析(sentiment analysis,也称情感分析)主要是利用相关算法来挖掘文本中隐藏的消息发送者的个人情感,通常会将个人的情绪分为3个极性(正面、负面和中性),并且会给出它们的强度(强、弱)。在本研究中,利用“SentiStrength”情感分析工具来分析微博中上述两个社会话题的情绪水平。在先前关于Myspace和Twitter的研究中,“SentiStrength”工具已经被证实了是非常有效的,它主要是将检测文本与一个人为设计的全面的词典进行匹配,并且设计了一套有关于语言学的规则来判断这个文本流露的情绪水平。SentiStrength将积极情绪设定为1(中性)到5(强积极)5个等级,同样的将消极情绪也划分为一1(中性)到-5(强消极)5个等级,而对于每个分类文本,它都会同时给出积极和消极的得分。相比于标准的机器学习方法,在描述积极情绪和消极情绪方面,SentiStrength的算法具有较高的准确率。 首先本文通过下式来计算单个微博的情绪极性(senti-ment polity),而这也决定了情绪的方向(积极和消极)以及强度。 polarity=posi+nega (1) 由于积极情绪和消极情绪的取值范围分别为(1,5)和(-1,-5),所以依据上述公式得到的情绪极性的取值范围为(-4,4)。 考虑到当一条微博中同时存在积极情绪和消极情绪的词语,而且两者相互抵消导致polarity=O这种情况的发生,本研究引入了公式(2)来防止这种情况的发生。 sentiment=(posi-nega)-2 (2) 其中posi和nega与上面的取值区间相同,之所以减去2是为了消除数字的正负特征所代表的积极性和消极性给研究带来的混淆。sentiment的取值范围为[0,8]。 为了检测上述两个公式的准确性,本文从样本数据集中抽取了几条微博进行了测试,其中表示积极情绪的词语用“+”标出,消极情绪的词语用“-”标出,结果如下: 积极情绪: 澳大利亚再次在相同海域侦测到疑似马航的黑匣子,这真是条令人重燃希望(+)的消息,为那些乘客祈福(+)!! 积极情绪得分:4;消极情绪得分:-1 polarity:3=4+(-1);sentiment:3=4-(-1)-2 李某某案件终于宣判了,结果真是大快人心(+)! 积极情绪得分:2;消极情绪得分:-1 polarity:1=2+(-1);sentiment:1=2-(-1)-2 消极情绪: 对马航处理这次失踪事件的态度和做法感到很困惑(-),特别失望(-)!!! 积极情绪得分:1;消极情绪得分:-4 polarity:-3=1+(-4);sentiment:3=1-(-4)-2 李某某案件再次折射出“星二代”的教育问题(-1)!! 积极情绪得分:1;消极情绪得分:-3 polarity:-2=1+(-3);sentiment:2=1-(-3)-2 此外,针对不同的表情符号,本研究也将其视为是微博情绪评分的一项重要指标。 3.3 方法设计 3.3.1 变量设计 为了验证前文中设立的假设H1和H2,本研究为每条微博设定了如下变量: rt_number:一条微博被转发的次数; rt_timelag:一条微博发布与第一次被转发之间的时间间隔(单位为分钟); senti_number:一条微博中所表达的情绪总量。 文献通过对Twitter的研究发现,除了上述3个变量以外,还有其它一些因素影响用户的分享和转发行为,例如标签(hashtag)的数量、URL、粉丝数量等。因此,本研究设定的其它变量有: hashtag:一条微博中包含的标签数量; url:一条微博中是否含有ud超链接(该变量为布尔型变量); foilow:用户粉丝数量; activity:同一时间段内用户发布的微博数量。 在m和H4中,本研究假定消极情绪比积极情绪更能够影响微博的转发数量和转发的时间间隔。为了验证该假设,我们将前面设定的情绪总量与一个表示情绪极性的变量做交互运算。变量如下: neg:表示一条微博的情绪极性是否为消极的(布尔型变量); inter_term=senti_number×neg:综合了情绪总量的消极情绪影响因子。 3.3.2 回归方程 本研究运用回归方程来对设定的假设进行检验。对于H1,由于因变量a_number的值是非负整数,而且在样本集中,其标准差要大于均值,即出现了过离散现象。因此,本研究引用负二项回归模型的前提假设——即因变量是符合负二项分布的。负二项回归需要对因变量进行对数的变换,并且要求对评估系数进行指数转换以评估和说明其对因变量影响的大小。因此,本研究的回归方程模型如下:其中E(rt number)为rt_number的期望值。 为了检验m,本文引入了neg和inter_term两个变量,回归方程如下: 在H2中,本研究假设情绪化的微博能够诱发更多的转发和分享行为,而作为因变量的rt_timelag表示连续时间单元,因此本文在回归模型中引入最小二乘法(OLS)来检验H2。为了解释模型的非正态性,在运用OLS回归分析前对因变量进行了对数变换。对对数变换后的因变量进行Shapiro-Wilk检验,结果表明p值较高,不能拒绝该变量的正态性。回归方程如下(λ为常量): 为了检验H4,本研究将neg和inter_term两个变量引入到回归方程中: 4、数据分析与结果讨论 4.1 样本描述性分析 为了便于研究,本研究对收集到的微博数据进行了初步的处理,将微博的形式划分为原创型(带有@标志但不是转发别人的微博)、直推型(以@标志开头的微博)、转发型、带有URL链接型、单一型(即不含有@标志微博),其一般统计特征如表1所示。 从表1中我们可以看出转发型的微博占到整个微博样本集的1/3,而且带有URL链接的微博达到了一半以上,从这些数据我们可以得出微博的转发功能被多数用户经常使用,并且用户更倾向于分享那些带有URL链接的微博。 从表2中可以看出,在研究的两个样本集中,活跃和非常活跃的用户数量不到5%,但是其所发布的微博数量总和却达到了50%以上。这说明了在新浪微博中,意见领袖的现象十分突出,因此这部分人的情绪状态很可能对其粉丝和其他用户产生影响。 考虑到本研究的重点是情绪扩散对用户转发行为的影响,因此对收集到的微博进行了进一步的筛选,并按照被转发前50名用户和微博总样本数进行了分类对比,如表3所示: 表3的统计结果表明被转发次数前50名的用户其所发布的微博带有更多的情绪因素。而且无论是在被转发次数前50名用户样本中,还是在总样本中,含有较多积极情绪因素的微博数量是含有较多消极因素微博数量的两倍,这也说明了在新浪微博中,传达的积极情绪要多于消极情绪。 4.2 回归方程结果分析 4.2.1 转发数量 表4中列举的是关于回归方程中变量的描述性统计分析。对于“马航飞机失踪”和“李某某案件”两个热门社会话题的微博数据集来说,平均下来,一条微博大约被转发0.86到0.95次。而在rt_timelag方面,“马航飞机失踪”相关微博的rt_timelag大约为1个小时(58minutes),而“李某某案件”则相对较慢,为1个半小时(100minutes)。而两个微博样本集中所含有情绪性因素的总量平均值为0.41和0.45。在含有标签的平均微博数量方面,两者相差不是很多,分别为1.28和1.17,每个用户的平均粉丝数量则为625和867。 接下来本研究就前文中设定的假设进行检验,表5和表6表示了两个微博样本集中主要自变量的相关矩阵,而多重共线性检验表明本研究获取的数据不存在多重共线性问题。在H1中,本文假设一条微博中蕴含越多情绪性因素,其越容易被转发。因此本研究对公式(3)进行了负二项回归分析,两个微博样本集的分析结果如表7和表8所示。研究发现在两个微博样本集中,关于senti number变量的回归系数是比较令人满意的(b=0.06,p<0.01和b=0.04,p<0.1),这表明还有较多情绪因素的微博能够得到更多的转发。因此,H1得到了本研究数据的支持。由于负二项回归方程的运用,我们需要对一些变量系数进行指数化变换,以便其更具有解释性。以senti_number变量为例,其系数0.06表示的意思是在其它指标变量不变的情况下,每增加一个单位的情绪总量,就会引发1.06次的转发行为(exp(O.06)=1.06)。 为了验证H3是否成立,本研究对公式(4)进行了负二项回归分析,该假设的主要影响自变量为前文中提到的虚拟变量neg和复合变量inter_term。从表7和表8的负二项回归分析结果中可以看出,对于“马航飞机失踪微博样本集”来说,研究的检验结果显示inter_term的相关系数是不显著的。而“李某某案件微博样本集”inter_tenn变量的检验结果则是显著的(b=0.05,p<0.05),这说明了消极情绪比积极情绪能够引发更多的转发行为。因此,这种混合的检验结果表明本研究的实验数据并不完全支持m。 对于两个样本集来说,hashtag、ud和fonow这3个控制变量对微博转发数量同样有着重要影响。尤其是hashtag和follow同转发数量有着非常重要的联系。以实验结果为例,微博中每增加一个单位的标签(hashtag),就会导致增加0.38次的转发;每增加10%的粉丝数量,转发次数会提高4.8%。而用户的活跃度(activity)变量跟用户的转发行为有着很强的负相关性,这就表明高活跃度的用户发布状态并不一定会导致较高的转发次数,有可能会导致信息过载的问题。 4.2.2 转发速度 如前文所述,H2和H4是关于情绪因素同传播速度之间关系的假设,表9和表10展示了两个微博样本集的自变量的相关矩阵。与验证Hl和1-14一样,本研究对收集到的微博数据集进行了多重共线性检验,检验结果表明实验数据不具有多重共线性,能够进行进一步的分析。 在H2中,本文假设如果原始微博含有的情绪因素越多,第一次转发的时间距离其发布的时间就越短。为了验证该假设,本研究对前文中的公式(5)进行了OLS回归检验,结果如表11所示。结果表明senti_mmaber的相关系数在两个样本集中都具有显著性(b=-O.05,p≤0.05;b=-0.04,p≤0.01),而这也说明了相比于带有积极情绪因素的(以及中立的)微博,带有负面情绪因素的微博不仅被转发的次数较多,而且速度更快。例如,一条微博中每增加一个单位的情绪因素,其传播的时间间隔(rt_fimelag)就会减少5%(exp(-O.05)=0.95;exp(-O.04)=0.96)。因此,H2得到了很好的支持。但是实证分析的结果并不足以支持H4的成立,因此不能认为情绪的极性对微博传播的时间间隔(rt_timelag)有显著的影响。从表11中可以看出,控制变量的相关系数都具有显著性,和因变量都呈良好的负相关关系。这表明标签、URL、拥有较多的粉丝以及具有较高的活跃度都对微博的转发速度产生了正向的影响。 综上,本研究的所有假设的检验结果如表12所示: 5、总结 本文以新浪微博中两个热门的社会话题为研究对象,以情绪因素为主题,通过实证分析了微博中情绪因素对用户转发行为的影响。研究首先发现相比于中立性的微博,富有情绪色彩的微博更容易得到转发和传播;其次,研究通过负二项回归分析和OLS回归分析验证了本文设定的假设,并对控制变量和自变量的显著性进行了验证,实证结果说明情绪不仅对微博转发的数量有积极的影响,而且还可以提高微博的转发速度;此外,除了情感因素以外,实证研究的结果表明其他一些控制变量例如标签、URL、用户粉丝数量、用户活跃度等因素都对微博的转发数量和速度产生了影响。但是本研究还存有不足,一方面实证数据的来源只是微博中有关社会事件的热门话题,这很大程度上限制了研究成果的适用性;另一方面样本集比较小,这有可能会造成研究结论的片面性。在未来的工作中,需要将研究的对象扩展到社会媒体的其他领域(不仅仅局限于微博),开发更有效的数据采集工具以便获得大量的研究样本,分析情绪因素与用户回复行为之间的关系也是未来研究的重要方向。 |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。