基于社会网络的微博档案特征分析
房小可 赵宣哲 张雪
摘要:信息社会化的发展使得社交媒体成为档案信息交流的重要工具。本文以典型的社交媒体——微博为平台,运用统计方法和社会网络分析法对微博发布的档案信息及其主体进行统计和关系挖掘,发现当前社交媒体环境下微博档案信息的分享现况和主体之间的关联及特征。研究结果发现:中国南部地区的部分综合档案馆如温州档案、厦门档案等发布档案微博的比例较多且较频繁;微博上的档案主体相互关注程度比較低,难以实现有效交流;综合档案馆总体上比高校档案馆掌握更多的网络联系资源。
关键词:社会网络社交媒体微博微博档案微博档案实体
随着互联网的迅速发展,社交媒体成为记录人类社会生活变迁的重要载体,并成为大数据时代的热点。据第 40次《中国互联网络发展状况统计报告》显示,截至2017年6月,我国网民规模达7.51亿,微博作为一个用户关系的信息分享、传播及获取平台,用户使用率持续回升,达38.7%,较2016年12月上升1.6个百分点[1]。档案信息资源作为人类劳动和智慧的结晶,是社会文化的传承。社交媒体迅速渗透到档案界,成为信息交流和知识传播的重要平台,微信档案、微博档案纷至沓来。目前,这些社交媒体上的档案信息却未被有序整理,档案价值不能被有效挖掘,这妨碍了档案资源的有效利用。本文以此为出发点,借助社会网络分析工具对典型的社交媒体——新浪微博的档案主体和信息进行挖掘。
利用社会网络对社交媒体档案进行挖掘,理清不同主体之间的关联,对新媒体环境下档案传播具有重要意义。笔者在知网、维普、万方数据库进行检索,发现相关文献主要集中在三方面:其一是政务微博档案的研究,包括政务微博档案保存策略研究[2]、政务微博档案化管理策略研究[3]、政务微博档案资源的开发与利用研究[4]。其二是基于微博的档案传播研究,如蔡红[5]阐述档案部门开通微博的现状及所面临的挑战,分析档案微博的发展瓶颈,提出提高档案微博影响力的方法。其三是基于微博的档案工作研究,如夏婷婷等[6]认为微博在档案工作中有提高社会档案意识、促进档案部门交流的的作用,应提高社会公众对档案微博的重视程度。此外,张凡[7]针对微博平台,从中心性、小团体等方面对我国档案馆微博进行了社会网络分析,指明目前我国档案馆微博推广及合作情况。
综上,微博在档案工作中发挥着重要的宣传及交流作用,对微博档案进行社会网络分析具有重要意义,但已有研究更多地对微博档案管理各环节进行宏观阐述,缺少具体分析。虽有学者对我国档案馆微博进行了社会网络分析,但数据集较小且没有对不同类型的微博档案主体进行对比。本文基于此,选择综合档案馆和高校档案馆两种类型为数据集,对其进行社会网络分析并进行对比。
一、微博档案数据描述
笔者于2017年5月1日至10日登录新浪微博,以“档案”为关键词进行用户名查找,锁定微博档案主体,深入抓取微博之间的链接关系,最终得到注册新浪微博的档案主体数量为583个。以活跃程度为标准,选择发布微博数量为400条以上的微博,过滤活跃度低的微博主体及剔除无意义的微博主体,最后得到微博主体数量为149个。
需要说明的是,本文抓取的微博主体主要是综合档案馆和高校档案馆两种类型,军事档案馆和企业档案馆均不在抓取数据范围内。其中综合档案馆113个、高校档案馆36个。
(一)档案微博主体发布微博比例的分析
社交媒体强调以用户为中心的服务模式,强调用户参与和互动,这与档案行业开展信息个性化服务的宗旨是一致的,档案类微博在开展档案信息个性化服务中均遵循以用户为中心的原则,注重建立和增强与用户和档案机构工作人员的关系。同时,微博又是一个开放、自由的平台,人们可以在法律允许范围内畅所欲言,因此社交媒体给档案工作者与用户之间、用户与用户之间、档案工作者之间的交互,提供了新的渠道和空间。发布微博数量越多表明主体越活跃,服务意识越强。笔者经过一个月的统计,得到发布档案微博比例排名前十的主体(见表1)。
(二)档案微博主体发布档案微博的效率分析
社交媒体的信息更新速度非常快。档案微博发布的及时不仅可以更快实现资源共享,而且可以实现有效利用。笔者跟踪调查档案微博主体的微博发布状态,发现部分档案微博主体能及时更新发布内容,统计得到2017年月均发布档案微博频率和日均发布档案微博频率排名前十的主体(见表2)。
综合分析表1和表2可知,就发布微博比例和发布微博效率两个指标,排名前十的微博主体并未变化,说明在抓取数据中,发布微博比例较多的微博主体其发布频率也较高。
二、微博档案主体的社会网络分析
在149个样本数据基础上搜集每个档案主体的关注实体,以相互关注为主要指标构建共现矩阵,即如果两个微博主体相互关注,则二者在矩阵中取值为1,否则为0,得到的部分共现矩阵如图1所示。
(一)档案微博实体密度分析
网络密度可用于刻画网络中节点间互相连边的密集程度,是指在图形中实际存在数量的线与可能存在数量的线的比例,在社交网络中常用来测量社交关系的密集程度及演化趋势。一个具有N个节点和L条实际边的网络,其网络密度为d(G)=2L/N(N-1)。在社会网络分析软件UCINET上对149个微博中档案信息进行收集排列,导入构建的共现矩阵,除去孤立节点后,利用UCINET计算网络密度,整个网络的密度指标如表3所示;运用绘图功能Netdraw绘制生成微博档案实体网络关系图,去掉孤立节点后得到的结果如图2所示。
由表3计算结果可知,由149个微博档案节点组成的社交网络,连接边数共924条,其网络密度为0.0443。密度值介于0和1之间,值越接近1则代表彼此间的关系越紧密,由此可知,档案微博实体形成的网络密度相对较小,说明149个活跃的档案微博主体相互关注程度较低,并未实现有效交流。
由图2可知,对整体网络密度贡献大的节点集中在网络中心的几个节点上,大部分档案微博实体与其他实体关联并不密切,有些档案微博实体仅有一个相互关注关系。一方面,由于客观上的网络结构庞大,数据信息海量,大部分档案微博难以从海量的微博信息中提取有关信息;另一方面,大部分档案馆利用社交媒体渠道进行信息共享的方式单一,仅考虑到自身档案馆的发展而忽略了馆际间的交流与合作。
(二)档案微博实体网络中心性分析
社会网络分析中对重要性的探讨集中体现在“中心度”上,一般常用的中心度指標包括点度中心度、中间中心度和接近中心度。其中“点度中心度”刻画的是行动者的局部中心指数,点度中心度越高,该节点在网络中越重要[8];“中间中心度”考虑节点在连接其他节点时表现出的重要性,起到重要的连接作用;“接近中心度”的思想是节点越趋于中心,它们越能快速到达其他节点,即网络中的节点距离其他节点越近,接近中心性越大。
根据网络图的统计特性对档案微博主体之间的网络关系进行分析,分别得到其点度中心性、中间中心性和接近中心性指标,排名前十的综合档案馆微博和高校档案馆微博如表4所示。
由表4可知,由点度中心性来看,排名前十的全部为综合档案馆微博主体,如海盐档案、宿迁档案、佛山市档案局、东莞档案的节点均在30及以上,位居前五,说明这些档案微博主体掌握较多的网络联系资源,对其他档案微博的影响力大,而其他档案微博的节点中心度均较小,反映了这些档案微博主体与其他微博的联系较少,信息辐射范围小。在高校方面,没有一所高校的点度中心性在整个网络中排名前十,在高校微博领域排名前五的分别为同济大学档案馆、中大档案馆、中财档案馆、华东师范大学档案馆和西北工业大学档案馆,同理,这五所大学相对而言与其他微博的关联度较大。
由表5可知,宿迁档案在中间中心性指标中排名第一,指标值为8.964,说明宿迁档案在整个网络中起到十分重要的桥梁作用,由图2也可看出很多其他微博档案主体通过宿迁档案而产生关联关系。宿迁档案、佛山市档案局、蓉城档案、厦门档案和株洲档案排名前五,说明以上微博主体在整个网络连接中具有不可忽视的作用。在高校方面,位居前五的是同济大学档案馆、中大档案馆、四川大学档案馆、华东师范大学档案馆和北京科技大学档案馆,其中四川大学档案馆和北京科技大学档案馆虽不具有高点度中心性,但在连接重要节点方面有着重要作用,往往这种节点是较权威的节点。
由表6可知,海盐档案、东莞档案、佛山市档案局、宿迁档案和中山档案方志的接近中心性排名前五,彼此指标相差不大,说明该五个档案微博主体与网络中其他节点均具有最短距离;在高校领域,除中大档案馆、同济大学档案馆、中财档案馆、华东师范大学档案馆外,南昌大学档案馆也位居前五,且彼此差距非常小,说明高校领域中此五个微博主体较趋于中心,能快速达到其他节点。
(三)档案信息微博间的聚类分析
聚类分析是数据挖掘的最主要功能之一,聚类就是将数据对象分组为多个类或簇,在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。本文针对样本数据关注关系特征,拟对样本数据进行聚类,去掉孤立节点后得到的结果如图3所示。
由图3可知,根据UCINET的K-means聚类方法,档案微博主体可划分为八个独立的小群体。海盐档案、中大档案馆等微博主体具有相似性,表明这些微博主体有着相似点,即在利用微博分享档案信息过程中处于较活跃的状态,彼此相互关注数量较多;株洲档案、北京科技大学档案馆等微博主体被划分为同一类型,这些档案馆的交互关系数量相仿,且与中心位置的档案馆有着些许联系;依此类推,温州档案、西北民族大学档案馆属于一个类型,这些档案馆缺乏彼此间的微博交流,各个微博间几乎没有联系,而在这一类型的微博主体中高校档案馆所占比例相对较大。由此可以推断,愿意分享档案信息的微博主体不仅拥有更多的资源,而且由于马太效应使得具有类似分享行为的微博主体彼此拥有更多的交互性,并辐射其他微博群体,达到信息分享的增值效益。
三、讨论及结语
综上分析可知,综合档案馆无论在发布档案微博数量、比例、效率、作用等方面均优于高校档案馆,可见我国综合档案馆在档案宣传方面起到了先锋带头作用。但从分析结果来看,我国综合档案馆利用新渠道传播和宣传档案的力度仍需进一步加强,尤其在信息交流与传递越来越重要的新媒体时代,综合档案馆更应主动出击,建立互通互联的共享机制,利用社交媒体的便捷性扩大我国档案的影响力,传播档案文化及知识精髓。另外,高校作为教育、科研的圣地,在新媒体时代具有高影响力的微博主体力量总体上是薄弱的。在高校档案馆中起到重要作用的更多聚集于华东、华南地区。当下高校档案馆如何利用新媒体实现全方位的融合发展是亟须关注的问题。
本文以微博为例,运用统计和社会网络分析方法对档案微博比例及其主体的关联关系进行定量分析,探索目前微博档案的分享和档案微博实体交互现况,以期为社交媒体环境下档案研究提供数据支持。但本研究仍然存在一些局限:首先,只对地方微博档案和高校档案进行抓取和分析,并未覆盖企业档案等所有不同档案主体;另外,本研究只能体现一段时期内的相关状况,尚未随着时间推移动态变化。未来我们会扩大数据集,从不同社交媒体入手,更全面系统地分析当前社交媒体在档案界中的应用及其交互状况,为新媒体时代档案工作的发展提供参考。
*本文为国家社科基金青年项目“面向社会记忆构建的档案资源检索研究”(编号:18CTQ041)及北京市教育委员会社科计划一般项目“虚拟学术社区个性化知识推荐方法与应用研究”(编号:SM201811417007)的成果之一。
注释及参考文献:
[1]中国互联网络信息中心.第40次中国互联网络发展状况统计报告[EB/OL]. [2017-10-12].http://www. cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201708/ P020170807351923262153.pdf.
[2]黄新荣,吴建华.政务微博档案化保存初探[J].档案与建设,2012(4):4-6.
[3]杜永红.政务微博档案化管理策略研究[J].兰台世界,2014(8):37-38.
[4]范铮.“微时代”背景下政务微博档案资源的开发与利用[J].兰台世界,2015(32):27-29.
[5]蔡红.档案微博传播效果分析与研究[J].档案与建设,2014(2):33-35.
[6]夏婷婷,王红梅.社交媒体下的档案工作——以档案微博为例[J].档案,2014(12):57-59.
[7]张凡.我国档案馆微博社会网络分析[J].兰台世界, 2017(23):28-31.
[8]杨小兵.聚类分析中若干关键技术的研究[D].杭州:浙江大学,2005.
作者单位:北京联合大学应用文理学院