社会网络分析方法在链接分析中的应用研究
肖蒙蒙
【摘 要】互联网的快速发展,使其成为人们发布信息,获取信息的重要来源。网络链接包含了大量的信息,因此链接分析被图情领域的广大學者关注和研究。社会网络分析方法是研究链接网络的一种重要方法,在对链接网络的网络结构分析中有着不可替代的作用。论文从网络整体结构、节点结构以及子网络结构三个方面,归纳总结SNA测度在链接分析领域的应用,从而对社会网络分析在链接网络中的应用有整体的、全面的认识。
【Abstract】The rapid development of internet has made it become an important source for people to release information and obtain information. The web link contains a large amount of information, therefore, the link analysis is focused and studied by the majority of scholars in the field of library and information. The social network analysis method is an important method to study the link network, and it plays an irreplaceable role in the analysis of the network structure of the link network. This paper summarizes the application of SNA measurement in the field of link analysis from three aspects of the overall network structure, node structure and sub-network structure, so as to have an overall and comprehensive understanding of the application of social network analysis in the link network.
【关键词】社会网络分析方法; 链接分析; SNA测度
【Keywords】social network analysis method; link analysis; SNA measurement
【中图分类号】G353.1 【文献标志码】A 【文章编号】1673-1069(2018)08-0149-02
1 引言
互联网发展迅速,互联网上每个页面都包含着各种各样的信息,页面与页面之间的链接关系更是包含了大量的、潜在的信息。链接是网络的显著特征,网站、网页以及网页上的任何信息都可以通过网络链接的方式与其他相关信息联系起来,是实现 Web2.0平台上知识交流的重要方式和手段[1]。链接分析,即链接分析法,或称网络链接分析或超链分析,是以链接解析工具、统计分析软件等为工具,对链接数量、类型、链接集中与离散规律、共链现象等的分析,用于 Web网络中的信息挖掘及质量评价的一种方法[2]。
社会网络分析是用于描述和测量行动者之间关系或通过这些关系流动的各种有形或无形东西(如信息、资源等)的一种方法。社会网络研究的是节点以及节点之间各种各样的关系。从1996年开始,产生了很多社会网络分析在Web上的应用例子,通过链接簇或者核心节点标明网络中的核心资源。近几年,国内图情领域的学者运用社会网络分析方法研究博客、微博、企业以及网站之间的链接网络,来分析链接网络的结构特征,研究网络环境下的知识交流网络以及评价网站的竞争力、影响力等。在这些研究中,学者们用SNA测度对链接网络的整体网络结构特征、节点特征以及子网络结构特征等进行分析,从而对链接网络的结构,网站的地位与作用以及信息交流的规律与特征等有了更加全面和清晰的认识。本文从网络整体结构、节点结构以及子网络结构三个方面对SNA测度在链接分析领域的应用进行归纳和总结,以期对SNA测度在链接分析领域的应用有更加整体、全面的认识。
2 数据来源及研究思路
2.1 数据来源
笔者对CNKI和万方数据库中图情领域的文章进行主题为“社会网络分析”并含“链接分析”的检索,截止到2017年,共得到文献46篇。本文将对这46篇文献进行内容分析,总结社会网络分析方法的测度在链接分析领域的应用。
2.2 研究思路
本文通过对检索到的46篇文献进行内容分析,并进行归纳总结,将SNA测度在链接分析中的应用分为:整体网络结构、节点结构以及子网络结构这三个方面。以下笔者将这三个方面详细展开,进行分析。
3 结果及分析
3.1 整体网络分析
整体网络分析主要是分析整体网络的规模、紧密型、凝聚性、信息传输性能和效率以及网络的集中趋势等特征。
①密度。密度是网络中的现有连线数量和一切可能连线数量的比值,它用来揭示整个网络节点之间联系的紧密性,反映整个网络的凝聚力水平。②直径、聚类系数和平均路径长度。直径是网络中全部节点间最长的最短路径长度。聚类系数是与某个节点相连接的邻点之间的连线数和这些节点间能连出的最大边数的比值。平均路径长度是网络中存在的路径相连接的全部节点对之间的平均最短距离。这三个指标考察了网络的连通情况以及信息在网络中传递的效率与性能。③距离与凝聚力指数。距离是点与点之间构成的最短路径的长度。凝聚力指数是依赖于“距离”而计算得出的,取值在0~1之间。距离和凝聚力指数都可以表明整体网络的凝聚力。④中心势。中心性有两种指标:中心势和中心度。中心势是整个网络的内聚性围绕一些特定的点而聚集起来的程度,它描述了网络的整体集中趋势。中心势有三类:点度中心势可以分析网络的向心性和集中趋势;中间中心势可以看出一个网络中的资源被某些节点控制的程度;接近中心势能衡量整体网中节点独立性的集中趋势。
对链接网络进行整体性的结构分析,可以了解企业间、网群中、微博或博客用户间形成的鏈接网络的整体状况,分析节点在网络中的联系是否紧密,信息是否能高效、通畅的在网络中传递,以及网络中节点的整体趋势。整体网络结构分析就是为了对现实中存在的企业间、网群中、微博或博客用户间的社会关系进行客观的展示和说明。
3.2 节点分析
节点分析可以从个体角度分析单个节点在网络中所处的位置、地位和角色。包括中心度、结构洞和核心-边缘分析。
①中心度。中心度可以分析网络节点所处的位置,是个体权利的量化指标。中心度有三种:点度中心度是与一个节点直接链接的所有节点的数量,值越大,该节点在网络中的影响力就越大。中间中心度是一个节点位于网络中其余节点之间的程度,可以衡量该节点对网络中资源的控制程度以及对其他节点间联系的影响力。接近中心度是一个节点不受控制的程度,即该节点的独立性。②结构洞。结构洞,即社会网络中的一些个体无直接联系或关系间断的现象,从网络整体看好像网络结构中出现了洞穴,在结构洞中,将无直接联系的两者连接起来的第三者拥有信息优势和控制优势。所以,处于结构洞中第三者位置的节点具有更多的社会资本和资源优势。③核心-边缘。核心-边缘结构是由若干元素相互联系构成的一种中心紧密相连、外围稀疏分散的特殊结构。它可以分析网络中处于核心位置和边缘位置的节点。
对链接网络中的单个节点做分析,可以找出企业间、网群中、微博或博客用户间核心的、影响力大的企业、网站和用户,发挥他们的积极作用;也可以分析哪些企业、网站或用户对整个网络中的资源、节点之间的联系有较大的控制力,要对它们进行积极的引导,促进网络中的信息、知识的流动和共享;对于边缘位置的企业、网站或用户,要鼓励它们积极的和网络中的其他节点进行沟通和联系,提高自身的地位,获取网络中的信息,促进自身发展。
3.3 子网络分析
凝聚子群是满足如下条件的一个行动者子集合,即在此集合中的行动者之间具有相对较强的、直接的、紧密的、经常的或积极的关系。在链接分析中的应用主要集中于凝聚子群密度分析、成分分析、派系分析、k-核分析和k-丛分析。
凝聚子群的密度可以分析网络中的小团体,如果小团体现象严重,会影响整个网络的信息沟通,不利于管理。成分分析、派系分析、k-核分析和k-丛分析都是将整体网络划分为多个小团体,只是它们的划分依据不同。成分分析是根据子群内外节点关系的紧密度将网络划分为成分;派系是网络中最大的完备子图;k-核与 k-丛都是建立在点度数基础上的凝聚子群,k-丛要求各个点都至少与除了k个点之外的其他点相连,而 k-核要求任何点至少与 k个节点相连。
通过对企业间、网站间、微博或博客用户间的链接关系做凝聚子群分析,可以看出企业之间、网站之间或微博、博客用户之间的派系林立的情况,找出核心团体、中介团体,进而分析整个企业群、网站群、用户群对核心团体的依赖程度;除此之外也可以揭示团体内、外部的信息交流传播模式,进而可以为发挥核心团体的引导作用,改善整个网络的信息交流效率而做出努力,从而提高企业、网站的竞争力,促进企业、网站或用户间的信息交流和传播。
4 结语
本文对社会网络分析方法在链接关系网络中的应用进行了归纳和总结,从整体网络结构、节点结构以及子网络结构三个方面详细分析了SNA测度在链接网络分析中的作用,并对这些分析的现实意义做了阐述。社会网络分析方法是链接网络分析的重要方法之一,但是随着信息多样化、网络复杂化的趋势越来越明显,SNA不能很好地适用于新的研究问题,如何在链接分析领域引入新的分析方法,对其进行更深入、有效的分析,是一个值得思考的问题。
【参考文献】
【1】杨瑞仙. Web2.0环境下的链接关系研究——以博客和百度百科为例[J]. 情报杂志,2013,32(09):199-203.
【2】邱均平,李江. 链接分析与引文分析的比较[J]. 中国图书馆学报,2008(01):60-64.
【摘 要】互联网的快速发展,使其成为人们发布信息,获取信息的重要来源。网络链接包含了大量的信息,因此链接分析被图情领域的广大學者关注和研究。社会网络分析方法是研究链接网络的一种重要方法,在对链接网络的网络结构分析中有着不可替代的作用。论文从网络整体结构、节点结构以及子网络结构三个方面,归纳总结SNA测度在链接分析领域的应用,从而对社会网络分析在链接网络中的应用有整体的、全面的认识。
【Abstract】The rapid development of internet has made it become an important source for people to release information and obtain information. The web link contains a large amount of information, therefore, the link analysis is focused and studied by the majority of scholars in the field of library and information. The social network analysis method is an important method to study the link network, and it plays an irreplaceable role in the analysis of the network structure of the link network. This paper summarizes the application of SNA measurement in the field of link analysis from three aspects of the overall network structure, node structure and sub-network structure, so as to have an overall and comprehensive understanding of the application of social network analysis in the link network.
【关键词】社会网络分析方法; 链接分析; SNA测度
【Keywords】social network analysis method; link analysis; SNA measurement
【中图分类号】G353.1 【文献标志码】A 【文章编号】1673-1069(2018)08-0149-02
1 引言
互联网发展迅速,互联网上每个页面都包含着各种各样的信息,页面与页面之间的链接关系更是包含了大量的、潜在的信息。链接是网络的显著特征,网站、网页以及网页上的任何信息都可以通过网络链接的方式与其他相关信息联系起来,是实现 Web2.0平台上知识交流的重要方式和手段[1]。链接分析,即链接分析法,或称网络链接分析或超链分析,是以链接解析工具、统计分析软件等为工具,对链接数量、类型、链接集中与离散规律、共链现象等的分析,用于 Web网络中的信息挖掘及质量评价的一种方法[2]。
社会网络分析是用于描述和测量行动者之间关系或通过这些关系流动的各种有形或无形东西(如信息、资源等)的一种方法。社会网络研究的是节点以及节点之间各种各样的关系。从1996年开始,产生了很多社会网络分析在Web上的应用例子,通过链接簇或者核心节点标明网络中的核心资源。近几年,国内图情领域的学者运用社会网络分析方法研究博客、微博、企业以及网站之间的链接网络,来分析链接网络的结构特征,研究网络环境下的知识交流网络以及评价网站的竞争力、影响力等。在这些研究中,学者们用SNA测度对链接网络的整体网络结构特征、节点特征以及子网络结构特征等进行分析,从而对链接网络的结构,网站的地位与作用以及信息交流的规律与特征等有了更加全面和清晰的认识。本文从网络整体结构、节点结构以及子网络结构三个方面对SNA测度在链接分析领域的应用进行归纳和总结,以期对SNA测度在链接分析领域的应用有更加整体、全面的认识。
2 数据来源及研究思路
2.1 数据来源
笔者对CNKI和万方数据库中图情领域的文章进行主题为“社会网络分析”并含“链接分析”的检索,截止到2017年,共得到文献46篇。本文将对这46篇文献进行内容分析,总结社会网络分析方法的测度在链接分析领域的应用。
2.2 研究思路
本文通过对检索到的46篇文献进行内容分析,并进行归纳总结,将SNA测度在链接分析中的应用分为:整体网络结构、节点结构以及子网络结构这三个方面。以下笔者将这三个方面详细展开,进行分析。
3 结果及分析
3.1 整体网络分析
整体网络分析主要是分析整体网络的规模、紧密型、凝聚性、信息传输性能和效率以及网络的集中趋势等特征。
①密度。密度是网络中的现有连线数量和一切可能连线数量的比值,它用来揭示整个网络节点之间联系的紧密性,反映整个网络的凝聚力水平。②直径、聚类系数和平均路径长度。直径是网络中全部节点间最长的最短路径长度。聚类系数是与某个节点相连接的邻点之间的连线数和这些节点间能连出的最大边数的比值。平均路径长度是网络中存在的路径相连接的全部节点对之间的平均最短距离。这三个指标考察了网络的连通情况以及信息在网络中传递的效率与性能。③距离与凝聚力指数。距离是点与点之间构成的最短路径的长度。凝聚力指数是依赖于“距离”而计算得出的,取值在0~1之间。距离和凝聚力指数都可以表明整体网络的凝聚力。④中心势。中心性有两种指标:中心势和中心度。中心势是整个网络的内聚性围绕一些特定的点而聚集起来的程度,它描述了网络的整体集中趋势。中心势有三类:点度中心势可以分析网络的向心性和集中趋势;中间中心势可以看出一个网络中的资源被某些节点控制的程度;接近中心势能衡量整体网中节点独立性的集中趋势。
对链接网络进行整体性的结构分析,可以了解企业间、网群中、微博或博客用户间形成的鏈接网络的整体状况,分析节点在网络中的联系是否紧密,信息是否能高效、通畅的在网络中传递,以及网络中节点的整体趋势。整体网络结构分析就是为了对现实中存在的企业间、网群中、微博或博客用户间的社会关系进行客观的展示和说明。
3.2 节点分析
节点分析可以从个体角度分析单个节点在网络中所处的位置、地位和角色。包括中心度、结构洞和核心-边缘分析。
①中心度。中心度可以分析网络节点所处的位置,是个体权利的量化指标。中心度有三种:点度中心度是与一个节点直接链接的所有节点的数量,值越大,该节点在网络中的影响力就越大。中间中心度是一个节点位于网络中其余节点之间的程度,可以衡量该节点对网络中资源的控制程度以及对其他节点间联系的影响力。接近中心度是一个节点不受控制的程度,即该节点的独立性。②结构洞。结构洞,即社会网络中的一些个体无直接联系或关系间断的现象,从网络整体看好像网络结构中出现了洞穴,在结构洞中,将无直接联系的两者连接起来的第三者拥有信息优势和控制优势。所以,处于结构洞中第三者位置的节点具有更多的社会资本和资源优势。③核心-边缘。核心-边缘结构是由若干元素相互联系构成的一种中心紧密相连、外围稀疏分散的特殊结构。它可以分析网络中处于核心位置和边缘位置的节点。
对链接网络中的单个节点做分析,可以找出企业间、网群中、微博或博客用户间核心的、影响力大的企业、网站和用户,发挥他们的积极作用;也可以分析哪些企业、网站或用户对整个网络中的资源、节点之间的联系有较大的控制力,要对它们进行积极的引导,促进网络中的信息、知识的流动和共享;对于边缘位置的企业、网站或用户,要鼓励它们积极的和网络中的其他节点进行沟通和联系,提高自身的地位,获取网络中的信息,促进自身发展。
3.3 子网络分析
凝聚子群是满足如下条件的一个行动者子集合,即在此集合中的行动者之间具有相对较强的、直接的、紧密的、经常的或积极的关系。在链接分析中的应用主要集中于凝聚子群密度分析、成分分析、派系分析、k-核分析和k-丛分析。
凝聚子群的密度可以分析网络中的小团体,如果小团体现象严重,会影响整个网络的信息沟通,不利于管理。成分分析、派系分析、k-核分析和k-丛分析都是将整体网络划分为多个小团体,只是它们的划分依据不同。成分分析是根据子群内外节点关系的紧密度将网络划分为成分;派系是网络中最大的完备子图;k-核与 k-丛都是建立在点度数基础上的凝聚子群,k-丛要求各个点都至少与除了k个点之外的其他点相连,而 k-核要求任何点至少与 k个节点相连。
通过对企业间、网站间、微博或博客用户间的链接关系做凝聚子群分析,可以看出企业之间、网站之间或微博、博客用户之间的派系林立的情况,找出核心团体、中介团体,进而分析整个企业群、网站群、用户群对核心团体的依赖程度;除此之外也可以揭示团体内、外部的信息交流传播模式,进而可以为发挥核心团体的引导作用,改善整个网络的信息交流效率而做出努力,从而提高企业、网站的竞争力,促进企业、网站或用户间的信息交流和传播。
4 结语
本文对社会网络分析方法在链接关系网络中的应用进行了归纳和总结,从整体网络结构、节点结构以及子网络结构三个方面详细分析了SNA测度在链接网络分析中的作用,并对这些分析的现实意义做了阐述。社会网络分析方法是链接网络分析的重要方法之一,但是随着信息多样化、网络复杂化的趋势越来越明显,SNA不能很好地适用于新的研究问题,如何在链接分析领域引入新的分析方法,对其进行更深入、有效的分析,是一个值得思考的问题。
【参考文献】
【1】杨瑞仙. Web2.0环境下的链接关系研究——以博客和百度百科为例[J]. 情报杂志,2013,32(09):199-203.
【2】邱均平,李江. 链接分析与引文分析的比较[J]. 中国图书馆学报,2008(01):60-64.