标题 | 基于NetLogo平台的信息分布仿真研究 |
范文 | 齐小英
摘要:随着信息社会的到来,信息逐渐成为个体/组织的重要资产,而个体/组织所拥有信息的数量也是影响贫富分化的因素之一。因此,将经济学中的基尼系数引入信息分布规律研究可以有效地刻画信息不对称现象。该文基于仿真方法和基尼系数指标研究信息分布的规律以及不同实验参数对基尼系数的影响。研究结果表明,信息主体与信息量的关系基本上符合二八准则,并且呈现幂律分布特征;当信息主体数量越多,基尼系数则越小,即信息不对称现象会逐渐减弱。 关键词:NetLogo;信息分布;信息不对称;计算机仿真 中图分类号:TP391.9 ? ? ? ?文献标识码:A 文章编号:1009-3044(2020)17-0202-03 1问题的提出 在信息社会,个体/组织所拥有的财富量受很多因素影响,其中最重要的因素就是信息不对称,一般个体获得的信息越多,就越容易拥有财富。有学者曾提出,信息的分布规律体现着信息本身的二重性——它既是个人认知的基本材料,也是经济发展的战略资源。个人认知层面产生的交互效应复杂且难以量化,而且经济社会发展影响个人认知,个人认知也反过来限制其信息的获取和利用[1-2]。人类社会虽然是一个复杂的系统,但学者们往往都采用不同的定性和定量方法研究相关问题。经济学领域为了测量财富分配的不平等,通常使用“基尼系数”指标。在本文中,此指标用来衡量信息不对称。为了更加深刻地研究信息分布以及为减轻信息不对称现象提供理论和实践指导,笔者将通过仿真揭示信息分布的规律及对信息不对称现象的影响。 2相关研究 笔者通过文献调研,发现当前研究信息分布方面的文献数量很多。研究学科大多分布在图情、新闻、医学等领域;研究主题主要包括计量分析、引文分析、幂律分布等;研究领域包括学术、社交媒体、企业等。在学术和决策方面,李健(2004)改进了传统文献计量学的研究方法和计量指标,并分析了网络结构单元中学术信息的分布[3]。袁毅(2006)也研究了网络结构单元中学术信息分布规律[4]。汪姝辰(2015)从高校图书馆出发,研究读者借阅信息分布规律[5]。王宏鑫和刘洋(2018)探讨了h-指数与信息计量分布规律关系[6]。上述研究结果表明,网络环境中学术信息的分布呈现“集中—分散”规律。黄鑫(2011)研究了信息分布(团队讨论前所获取的共享信息与未获取的共享信息的比例)对团队决策的影响[7]。在社交媒体方面,王晓光(2011)认为微博信息传播规律分布符合“二八法则[8]。宋恩梅和朱梦娴(2015)分析了"豆瓣电影"和"新浪微博"两个平台的电影评论信息的分布特征和规律,即社会化媒体的信息分布符合幂律分布[9]。方爱华和陆朦朦等(2017)以数字音乐为研究对象,分析信息分布规律,发现音乐市场整体呈现"分众+长尾"趋势[10]。田纯(2019)基于洛特卡定律与布拉德福定律研究了用户社会化标签信息分布规律[11]。 宏观理论方面,马费成和裴雷(2003)总结并分析了网络信息资源的集中分散规律、生产规律和时间分布规律等[12]。Oluseyi(2010)分析信息在三个不同时期(传统社会、Web1.0和 Web2.0 )的分布都符合指数分布[13]。李鋆(2018)认为“信息幂律分布”研究分为三个层面:定性、定量和动力机制研究,其研究历史总体经历了 “由现象到本质,由宏观到微观,由定性到定量,由空间到时间,由结构到过程”的不断深化过程[14]。物理学家Victor M.Yakovenko(2000)提出了一个最简单的人工经济模型:财富分布模型[15]。 总体而言,在研究内容方面,大多数文献仅仅只是研究了信息分布的规律,并未深入研究信息分布和信息不对称之间的关系。在研究方法方面,学者们通过定性或者定量的研究方法来研究信息分布的规律,很少使用仿真方法。同时,计量分析引用的大多都应用布拉德福定律、洛特卡定律等,未曾有学者引入基尼系数。因此,本文在前人研究基础上,基于仿真并将基尼系数引入信息分布的研究是一个创新性的设计,可以弥补理论研究的局限性。 3模型的建立 在仿真模型中,每个信息主体都拥有特有的属性以及一定的行为方式。随着时间的不断演进,主体之间交互作用,个体的属性也随之不断变化,通过观测复杂系统所表现出的宏观现象,分析归纳其具有的规律。因此,通过仿真可以探究微观个体行为与宏观规律之间的联系。 3.1社会信息交易的规则 假设在信息社会这个系统中,信息主体和信息总量保持不变。开始时,每个信息主体都有相同的信息量,每当两个主体相遇,则随机分布信息。有两个交易主体M和N,交易之前所拥有的信息量为M1和N1, 各自的信息保留率为S1和S2。那么各自用来交易的信息为M1=(1-S1)* M1,N1=(1-S2)* N1。那么交易信息总共为M1+ N1,随机分布之后的信息为M2=(1-δ)(M1+ N1),N2=δ*(M1+ N1)。意大利统计与社会学家Corrado于1922年提出了一个衡量收入分配不平等的指标——基尼指数(Gini)。信息不对称(asymmetric information)指交易中的个体拥有不同的信息,始终处于一种不对称的状态[16]。信息不对称之所以产生是因为不同个体获取信息能力有所差异,而个体获取信息的能力又与社会经济因素有关[17]。因此,本文采用基尼系数来衡量信息不对称。 3.2仿真流程 通过Netlogo 仿真模拟信息分布的过程,规定个体属性与行为方式的基础上,通过调整相关参数,进一步得到并分析仿真输出。在仿真过程中,对现实世界的模拟是基于一定的假設基础之上,现实世界中主体之间的行为与关系是错综复杂并且不断变化的。因此,根据研究目的设置相应的情境,对现实世界进行逻辑的简化,在文献实证研究的基础上尽量使得仿真模拟与现实的拟合度较强。 在初始化阶段,设置信息主体、信息量,信息保留率,并使信息量平均分配到每个主体。在实施阶段,主体之间进行交易信息,在获得交易之后的信息量及基尼系数地可视化展示之后,分析信息分布的规律。最后,通过行为空间获取不同参数实验数据来分析信息分布和信息不平等的关系。如果此过程未成功,则继续循环,返回去重新实施,直到得到计算结果,如图1所示。 3.3实验参数设置 本模型比较简单,通过对参数的调节来模拟不同的仿真情景,具体的参数包括信息主体、信息量、信息保留率等。其中,信息主体范围设定在0-1000,信息总量范围设定在0-1000000,信息保留率是一个[0-1]的随机数。具体设定如表1。 4仿真实验和结果分析 4.1 仿真实验 本模型对信息主体之间交易信息进行仿真,从而描绘出信息分布曲线、洛伦兹曲线以及计算出基尼系数。本模型具有以下特征:运行次数是可控的,并且按照时间步更新。通过运行得到信息分布(图2)、洛伦兹曲线(图3)以及基尼系数(图4)等可视化图。进一步为了探索具体的参数组合对信息分布的影响,通过行为空间(Behavior Space)工具收集数据。首先设置了不同的组合,信息量的组合[“total_information”[10000 10000 100000]]表示,初始值为10000,间隔10000,结束值为100000,信息主体同理,即[“num_agents” [100 100 1000]],并且每组运行重复2次,求基尼系数的平均值以减少误差。 4.2 ?结果分析 随机调整参数发现,当信息主体数量是229,信息量为121387时,洛伦兹曲线信息主体值为80.1%,信息主体值为20%,基本上符合二八准则,即80%的信息掌握在20%的信息主体手中,如图3所示。基尼系数则一开始快速增长至0.6以后,然后缓慢增长,随后在0.659趋于稳定。在经济学中,当基尼系数大于0.5时,则表示收入有很大差距。在本文中,基尼系數为0.659则表示信息社会中,信息确实是不对称的。 随后笔者通过Matlab软件对数据进行了拟合,拟合效果大致符合幂律分布。虽然仿真周期不同,每次运行的结果也有所差异,但是经过笔者多次运行,发现误差范围都不大。为了高效的分析实验结果,本文分析了实验数据中1000,10000,100000信息量分别在对应的200,400,600,800,1000信息主体下的基尼系数变化。 图5显示,三条曲线的基尼系数一直呈先上升后下降的变化规律,大体上符合集中—分散规律。当信息主体数量时200时,信息量越小,基尼系数越大;当信息主体数量时400时,信息量越大,基尼系数越大;当信息主体数量时600、800、1000时,信息量越小,基尼系数越大。当信息量为1000和10000时,随着信息主体数量增加,基尼系数也是先上升后下降,曲线有两个峰值;当信息量为100000时,基尼系数也是先上升后下降,但曲线只有一个峰值。整体来看,当信息量越小时,随着信息主体数量增加,基尼系数越大;当信息量越大,随着信息主体数量增加,基尼系数越小。 结合理论和上述分析结果可知,随着信息社会的发展,信息量必然是增多的,当信息主体增加时,信息不对称现象会逐渐减轻。之前社会的信息不对称需要企业等组织去对接,但如今信息技术替代了企业成为中介,社会主体由物质架构开始转向知识架构。因此,各种新独立个体经济出现,如宣传中国文化的李子柒、直播带货的李佳琦等,这导致了信息人才将成为未来社会的第一生产力,也就是信息主体。换句话说,笔者大胆猜测信息主体数量和信息不对称现象有可能成反比,或许本实验还不足以说明,但未来笔者将做更多实证研究进行验证。 5结论和研究局限 本研究在借鉴前人研究的基础上,基于仿真方法研究信息分布规律,并引入基尼系数分进一步分析二者之间的关系,进行了创新性的探索。本研究结论如下。 (1)信息分布基本上符合二八准则,并且呈现幂律分布特征。 (2)当信息量越大,随着信息主体数量增加,基尼系数越小,信息不对称现象会逐渐减轻,即信息主体数量和信息不对称现象有可能成反比。 本研究的局限主要体现在。 (1)概念模型构建方面:本文虽然将基尼系数引入了模型,但是未考虑其他影响因素。因此,研究结果可能会有一些偏差,使实验结果不能精确的反映现实情况。 (2)仿真实验方面:虽然通过行为空间得到了实验参数数据,但由于笔者理论知识不足,仅对其进行了简单的统计分析,并未展开深入分析。 信息分布规律还是有很大研究空间的,尤其是引入了仿真研究方法后,可以为如何减轻信息不对称现象提供借鉴。在未来的相关仿真研究中,可以融入更多的因素,考虑更多的可能情况,这样可以使得研究具有更大的理论和实践意义。 参考文献: [1] 于良芝.“个人信息世界”——一个信息不平等概念的发现及阐释[J].中国图书馆学报,2013,39(1):4-12. [2] 于良芝,周文杰.信息穷人与信息富人:个人层次的信息不平等测度述评[J].图书与情报,2015(1):53-60+76. [3] 李健.网络结构单元中学术信息分布的计量研究[J].图书情报工作,2004(1):44-47. [4] 袁毅.网络结构单元中学术信息分布规律研究[J].现代情报,2006(2):45-48. [5] 汪姝辰.高校图书馆读者借阅信息分布规律研究——以湖南师范大学图书馆为例[J].科技情报开发与经济,2015,25(08):15-18. [6] 王宏鑫,刘洋,黄丽珺,等.h-指数与信息计量分布规律关系探讨[J].情报探索,2018(7):7-11. [7] 黄鑫.情绪、信息分布对团队决策的影响研究[D].湖南师范大学,2011. [8] 王晓光.微博社区交流结构及其特征研究[D].上海:华东师范大学,2011:20. [9] 宋恩梅,朱梦娴.社会化媒体信息分布规律研究:以电影评论为例[J].信息资源管理学报,2015,5(3):25-36. [10] 方爱华,陆朦朦,朱静雯.用户评论视域下数字音乐信息分布规律探析——以网易云音乐热歌榜为例[J].出版广角,2017(3):72-76. [11] 田纯.基于洛特卡定律与布拉德福定律的用户社会化标签信息分布规律研究[J].甘肃科技,2019,35(17):85-91. [12] 马费成,裴雷.网络信息资源的分布规律[J].情报科学,2003(11):1121-1124+1169. [13] Oluseyi M V, Gallop J D. Self-service and social media: communication hierarchy and message diffusion in participatory media[C]//2010 IEEE International Professional Comunication Conference. IEEE, 2010: 243-254. [14] 李鋆.“信息幂律分布”研究的历史逻辑及其现实意义[J].现代传播(中国传媒大学学报),2017,39(04):140-147. [15] Dragulescu A, Yakovenko V M. Statistical mechanics of money[J]. The European Physical Journal B-Condensed Matter and Complex Systems, 2000, 17(4): 723-729. [16] 趙丽娟,王大龙.基于信息不对称理论的情报失察研究[J].情报探索,2012(10):1-4. [17] 付云,孙振领.论竞争情报中的信息不对称[J].黑龙江史志,2008(23):84-85. 【通联编辑:朱宝贵】 |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。