大数据分析在公共事务管理中的应用及挑战

邹晨诺
摘要:围绕大数据的概念、实质与实际问题,研究者需对公共事务管理如何成功应对大数据革命有深入的思考。公共事务中的大数据是指传感器、计算机网络以及个人在互联网上公开的信息以及大规模收集的管理数据的集合。在公共事务中,使用大数据以实时洞察团体行为模式机会正在出现,但也遇到了数据搜集、隐私方面的挑战。公共事务管理人员需改变思维,适应变化。
关键词:大数据 公共事务管理 数据获取 个人隐私
中图分类号:G2 文献标识码:A
1 大数据的定义
大数据目前被用来描述这个数据密集型社会的方方面面,它既可以指数据量,用于从多个来源收集大规模数据的计算实践,也可以用来描述实时处理这些数据的分析策略。大数据分析主要用于关注由互联网用户产生的数据的新形式,比如通过社交网络的“关注”机制建立起的网络、网站之间的连接以及移动设备之间的连接。由此,大数据分析的应用程序可以与用户的社会关系相结合,从而获取更为深层次的信息。大数据还可以由“物联网”产生。物联网中的设备利用互联网以控制一些细微的参数,如用户房子的温湿度、用户电动车的电量、移动设备的电量等。此外,还可以通过一些新型的传感器获取更多数据[1]。越来越多的用户信息会由全新的设备被动地获取,如位置、速度、健康数据等。
目前,一个较为广泛接受的对于大数据的描述是:“体积庞大”(Volume),“速度极快”(Velocity),“形式多样”(Variety),与“价值密度低”(Value)。”这些描述被用于区分大数据与小数据,后者往往是被限制的、单一的。在公共事务中,对于大数据这一概念的公开定义很少。然而,已有两个新近出现的跨界领域:计算社会科学[2]与政策情报学[3]。计算社会科学强调通过GPS追踪、监控视频或公共场所中的无线连接,以及社交网络这些无处不在的信息源获取大量的,与个人信息结合的数据,从而对整个社会产生深刻的认识。政策情报学则是:“研究如何通过计算与通信技术去理解与解决复杂的公共政策与管理问题,从而创新治理流程与机构。”
虽然此处提出的跨界领域已影响了公共事务与大数据的接触,然而对于大数据实践与公共事务研究相关的问题的范围的思考还较少。
2 公共事务视角中的大数据
公共事务研究中的大数据集中于公共,或民众个人所生成的多形式的,结构化与非结构化并存的数据的集合。虽然大数据的某些方面在各个领域都是一致的:一是个人用户在使用网络时产生的数据,如社交媒体上的数据;二是各类传感器自动获取的数据,例如在建筑物,街道上无处不在的摄像头,以及汽车的GPS等设备。然而,公共事务视角中,大数据也包括公共实体在其运作过程中自动收集的数据[4]。虽然当前,大数据的粒度依然略显粗糙,但随着智能设备不断进入生活,数据的采集会越来越自动化,采集精度也越来越高。
第一,将大数据应用于公共事务中是一个长远的目标,至少在目前,应用的可能性与深度较低。当前的大数据分析提供的是对于用户在线偏好、能源消耗与运动、位置信息的平均分布的结论,然而这些结论远远不足以实现公共事务中大数据分析的目标——通过规模分析与综合分析来分析小群体、极端与罕见事件并进行预测。
第二,使用大数据进行分析的一个优势是检查问题的实时性。大数据可以结合现有的传统数据,如行政程序、调查结果,与历史悠久的政府数据如人口普查数据,对民众的行为模式进行分析[5],这个过程也被一些学者称为“预测当前”。此外,结合在线支付,搜索结果,物流,以及网络购物平台的数据可以帮助政府机构预测诸如失业率等经济指标[6]。
然而,尽管公共事务视角下的大数据在本质上越来越全面与细化,但在实践中仍然存在许多挑战。
3 公共事务中大数据分析的挑战
大数据给公共事务带来的优势在于丰富、及时的、精细的关于行为与现象的数据。在过去,这些数据是难以获取,同时昂贵的。随着互联网的迅速发展,数据产生的速度与规模越来越大,也给数据的获取带来了许多便利。随之而来的,也有诸如潜在的对隐私的侵犯,数据获取、分析等方面的挑战。
3.1数据获取的挑战
当前情况下,公共事务中的大数据获取大多是间接获取的。因为这些数据并不是被公共事务管理人员抑或研究人员带有目的性获取的。事实上,大部分数据都是因为纯粹的技术原因被获取的——例如,为了追踪潜在的安全漏洞而自动登录网站——而不是在这些普通的任务之外进行特殊的数据获取。对于间接获取的数据的使用是十分诱人的,因为这些数据体量十分庞大,且相当全面,涉及每一个用户。然而,最近对于简介数据的使用经验表明,公共事务管理人员与研究者必须对间接数据的使用报以更多的小心。正如Lazer[2]所言,大多数的间接数据并不是经过精心设计从而收集到有效而可靠的数据。相反,这些数据大多是被设计以符合商业利益抑或技术逻辑。比如谷歌的搜索算法就是基于完全合法的商业原因更新,在用户与网站的行为影响下对从中获取的数据产生了不客观的影响。
3.2大数据与隐私
数据的匿名性是公共部门在使用大数据进行公共事务分析所面临的主要问题。这是对个人隐私的保护,也影响了公共事务大数据分析的效率与准确性。然而,最近的研究表明,可以利用多个数据源的数据来获取一个人的各类隐私。例如,在微博上发现的公共数据可以让人准确地判断用户的性别、职业、年龄、家庭住址、活动范围等信息。有了足够的数据,就可以重构出大量的识别信息,甚至可以推断出用户的行为,例如,从淘宝的购买习惯可以确认用户是否怀孕。这一数据丰富的环境也体现了大数据在公共事务中的应用的隐患——公共事务管理所需的大数据信息开放,事实上是与个人隐私保护矛盾的。虽说这是大数据分析的技术性质所决定的,然而技术的使用者容易在违法的边缘试探,在利益的驱使下利用个人隐私的数据谋取暴利。因此,如何在隐私保护与公共事务管理需求中平衡是公共事務管理者与研究人员急需解决的问题[7]。
4 大数据时代下公共事务管理的未来
大数据时代的到来已经是一个无法逆转的趋势。公共事务管理者应当拥抱改变,接受改变,将大数据应用于公共事务管理的方方面面,全面提升管理能力,做到与时俱进,运用大数据以获取过去难以发现的、深层次的信息。此外,公共事务管理人员应当将数据作为一项公共资源,将其向公众实时公开,这是公共事务管理的本身属性所需求的。因此,数据共享道路的首要措施便是向民众提供更多不涉及隐私、国家安全的信息。此外,各类公共事务管理部门之间的信息交互与信息共享也应当推进以进一步提升公共事务管理的效率。对于政府而言,大数据方面的立法需要尽快进行,让公共事务中的大数据分析有法可依,做到个人隐私保护与公共事务管理协调进行,共同发展。唯有如此,才能使得大数据对公共事务管理的推进稳定而有效。
参考文献:
[1] Bryant R , Katz R H, Lazowska E D. Big- data computing: Creating revolutionary breakthroughs in commerce[J]. Computing R esearch Association, 2008, 1–15.
[2] Lazer D, Pentland A S, Adamic L, et al. Life in the network: the coming age of computational social science[J]. Science (New Y ork, NY), 2009, 323(5915): 721.
[3] Johnston, Erik. Governance in the information era: theory and practice of policy informatics[M]. R outledge, 2015.
[4] 劉奥. 大数据时代下的公共管理创新[J].人力资源管理,2018(1):3- 4.
[5] Kitchin R , Mcardle G. What makes Big Data, Big Data? Exploring the ontological characteristics of 26 datasets[J]. Big Data & Society, 2016,3(1).
[6] Llorente A, Garciaherranz M, Cebrian M, et al. Social media fingerprints of unemployment.[J]. Plos One, 2015, 10(5).
[7] 胡键.大数据与公共管理变革[J].行政论坛,2016,23(6):32- 35.
相关文章!
  • 国有企业纪检监察有效性提升策

    王强中图分类号:D630.9 文献标识:A 文章编号:1674-1145(2019)4-132-01摘 要 纪检监察是国有企业健康发展的重要保障之一,随着国企反腐

  • 区级档案馆利用服务工作初探

    付永革摘要:本文以平谷区档案馆为例,就区级档案馆利用工作中存在跨区档案馆之间同类档案利用制度不统一、档案馆(室)之间的档案利用不

  • 环保工程“害民”根在以邻为壑

    何勇海小孩无故“流鼻血”、上百学生转学、居民半夜被臭醒……在深圳、惠州交界处,一边是深圳坪山环境园,污水处理厂、垃圾填埋场、污泥脱水厂