数据新闻的生产现状、影响与反思

莫凡
摘 要 数据新闻丰富了新闻生产实践,大数据新闻在选题、事实判断、信息呈现、信息订制与推送上展现了与传统新闻形态无可比拟的优势。我国进行数据新闻的尝试已5年有余,依然存在不少认识和操作的误区。文章通过对数据新闻的发展现状及带来的变革进行梳理,反思在数据新闻实践中还有哪些问题值得深入探讨。
关键词 大数据;数据新闻;精准定位;“长尾内容”
中图分类号 G2 文献标识码 A 文章编号 2096-0360(2018)08-0035-03
“互联网+”时代,数据成为各行各业关注的焦点,新闻传播行业亦不例外。2014年伊始央视利用大数据思维对春运进行报道,同年3月,人民日报对“两会”系列专题也利用了数据新闻的操作方式进行报道,国内媒体开始大面积尝试数据新闻。然而,经过几年的发展,我国新闻界在尝试数据新闻的过程中,不少认识、理解和操作的误区依然大面积存在,因此通过对数据新闻现状以及对其带来的新闻理念和新闻业务的变革进行梳理,反思数据新闻的未来发展就显得尤为重要。
1 数据新闻实践现状
1.1 混淆“数据新闻”与“大数据新闻”
纵观最近几年的传媒实务,在重大题材的报道里,比如每年的两会,都有数据解读、图表分析等报道样式,学业界普遍认为这是对大数据新闻的有益实践。但如果认真区分,我们不难发现,这些常见的样式我们可以称之为精确新闻、图表新闻或者数据新闻,却难以归为“大数据新闻”。舍恩伯格在《大数据时代》这样概括大数据的特征:不是随机样本,而是所有数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。目前的数据新闻实践,无论从数据的全面性、多样性、相关性,都不属于大数据的范畴。
以新华网数据新闻2018年3月发布的几篇文章为例,无论是涉及民生的《无肉不欢?那可能是过去时了》,还是科普文章《“区块链”大热,花几分钟了解一下》,所涉及的数据皆是局部而非整体,呈现多位因果关系而忽略其他关系,是数据新闻而非大数据新闻。在新华网数据新闻整个3月的报道中,唯一勉强算作大数据新闻的是《“区块链”大热,花几分钟了解一下》,文章设置了“大事件回顾”“数读现状”“技术特性”“投资情况”“应用领域”5个板块,这些板块中,现状和投资两个部分的数据运用了和这两个主题相关的全部数据,而非“抽样”数据,符合大数据新闻的全面性要求。但遗憾的是,该文章的“应用领域”板块,只列举了供应链和物联网、金融业、网络安全等六个领域,只有简单的百分比,缺少更详细的数据,更缺少做得好的企业的完全统计,该文章虽是大数据新闻但质量不高。
将“大数据新闻”与“数据新闻”等同操作,是目前媒体普遍存在的一种状况。大数据新闻只是数据新闻的一种,大数据新闻一定需要符合大数据的全面性、混杂性、相关性要求,也要符合操作过程中数据是来源、数据是表达方式、数据是结论的佐证方式等基本要求。
1.2 将含有数字的新闻报道都等同于数据新闻
计算机科学认为,数据是事实或观察的结果,是客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始素材。数据新闻里提到的“数据”,应该是一种广义上的数据,一部分指以数字符号形式呈现的内容,另一部分指数字背后所涉及到的关联影响。
从本文上一个问题的论述中,我们可以发现数据新闻与一般新闻报道对数字的零星使用不同,数据新闻从发现主题和表达主题上,都是数据为主角,无论是从一开始的新闻价值发现还是到最后的新闻主题呈现方式,都离不开数据,更离不开与数据相关的各种技术。
数据新闻的操作核心是运用数据思维去发现和报道新闻事实。只要符合这个前提,即便通篇都是文字的报道,只要能密切围绕数据来组织报道,同样也是数据新闻,而没有用这种操作理念进行的新闻报道,即便通篇都是数据,也不能称之为数据新闻。
1.3 数据来源难保证,缺乏与各自媒体的融合
笔者通过对搜狐“数字之道”、新华网“数据新闻”2017年1月1日到2018年3月28日发表的数据类新闻进行统计,通过其题材、地域、数据来源、阅读量、评论量等进行统计分析,以期更客观地得出关于数据新闻的现状。搜狐《数字之道》在此期间,共发表文章184篇,其中国内158篇,国际26篇,最高阅读量是2017年10月17日文章《各位党员请注意,有一个神秘箱子等你查收》,阅读人数432万;数据来源最多的是2017年4月13日《美410万华人超五成高学历,真的在被歧视?》,5个数据来源(World Library,美国人口统计局(2015年)、美国之音、Pew Research、Committee of 100)。新华网《数据新闻》在此期间,共发表文章502篇,其中国内489,国际13篇,最高点赞量文章是《习近平金句·奋斗》(新华网页面不显示阅读人数)9 009(截至2018年3月29日);数据来源最多为2017年8月11日文章《文艺、新闻舆论、网络文化、哲学社科 习近平如何看待这些领域》,12个数据来源(新华网、中国政府网、环保部、央视、中国环境报、人民日报、工人日报、检察日报、中青报、中新网、环卫科技网、中国人民大学)。
通过分析,我国数据新闻的阅读量、互动性普遍较差,最明显的是数据质量较差,具体表现为来源处单一、陈旧,语焉不详的特征。究其原因,首先是数据作为一种重要的资源,掌握在少数的大公司手里,传统媒体并不占有数据,传统媒体只能利用政府公开的数据,但我国政府公开数据的能力有限,因此即便是新华社、搜狐之类的全国性大媒体,在进行数据新闻报道的时候依然有很强的壁垒。其次还有网络水军、网络的言论监管、网名的过于情绪化发声,使得我们获取的原始数据,尤其是和意见性质相关的数据,难免主观性过强,无论是数据质量和数量都不能满足我们当前数据新闻报道的需要。
與此同时,我们目前对数据仍以浅层次的应用为主,呈现方式仍以数据来源方提供的原始形态或者仅仅是获得数据的简单加工,缺乏与各自媒体的融合。无论是新华网的“数据新闻”栏目、搜狐的“数字之道”栏目,还是被看作是中国大数据新闻报道典范的央视“‘据说春运”节目此方面都欠缺。以“‘据说春运”为例,央视2014年便开始使用LBS(基于位置的服务)定位可视化数据,播报我国春节人口迁徙情况。在此系列报道中,数据通过信息表格、动态图的形式进行画面呈现,主持人对这些图表加以阐述进行报道,但仔细观察,会发现无论出现在新闻中的“迁徙动态图”,还是根据数据做出的简单的“地区人口出入增长图”,大部分都是直接来源于数据提供方,这些图表皆是拿来就用,缺乏与各自媒体的契合。纵观目前大部分数据新闻,几乎所有的媒体用的都是同一张图,缺乏和各自媒体的真正融合,更缺乏深刻解读。
2 数据新闻实践影响
大数据作为一种新的动力注入新闻业,使新闻生产实践产生了新的变化,也拓展了传统新闻类型的报道边界,在用户分析、内容价值等多方面都产生了深远的影响。
2.1 大数据将用户的精准性分析变成常态
用户的行为数据、用户生产的内容,无疑都是现在大数据的重要来源,这些数据反过来重新被运用到新闻生产中,这种用户和内容的强连接关系是以往任何一种形式的新闻报道都无法比拟的。
以大数据对用户的分析为例,传统的受众调查多以抽样的问卷调查方式,样本量有限,成本高,周期长,无论是内在效度还是外在效度都很低,这样的数据很难支持新闻的生产决策。而大数据可以直接抓取或者支持更多的受众参与调查,较高的效率和较低的成本使得编辑在日常中迅速挖掘热点并完成选题,并且大数据分析不是要求用户对他们的行为习惯以问卷的方式做出回答,而是对他们日常的自发行为本身进行收集,这样的分析具有更真实、更全面的特征,因此将传统媒体不可能进行的全样本、跨平台分析变成了现实。
发展到现阶段的媒体都已经开始对用户群体细分。传统媒体的用户细分多为一些简单的人口指标划分,例如年龄、性别、地域、收入等,而数据算法的使用可以将他们各种指标特征与他们的态度、行为、价值偏好以及生活工作场景联合起来,形成一个更完整、立体、贴近现实的用户画像,实现了对每个个体用户的定向精准分析。
值得注意的一点是,数据的使用在新闻传播过程中除了用于用户画像,也广泛运用于精准推送,这种推送会是使个人接触到的信息无形中越来越偏向于自己感兴趣的领域,推送的内容会打着个性和精准的名目越来越窄化,“信息茧房”效应会越来越明显。
2.2 大数据带来的定向新闻推送的新范式,数据作为推送的依据,激活了新闻生产的“长尾内容”
大数据的使用,可以使得用户任何时间任何节点在网络上遗留下来的信息都能被记录、分析和聚合。以用户使用社交网站为例,大数据技术可以根据用户在社交网站上发布的内容以及所属类别、用户自标签、社会关系、社交行为,以及参与的群组、机型、使用时间等数据源,轻易地发现用户的兴趣点,并根据这些兴趣的重要程度或者先后顺序进行推送,不仅能实现用户和信息之间的精确匹配,也很容易为用户找到新的群组,增强用户与信息之间的黏性,用户与用户之间的黏性。
在这个过程中,通过对数据的挖掘,原来被忽视的大量的长尾信息被挖掘,这些非主流、个性化的产品需求,虽然是需求的尾巴,但是经过散落在社会各个角落中的用户的累积,大量传统的处于尾部的新闻资源和价值被重新重视,激活了新闻生产的“长尾内容”。在数据支持下的精准推送和需求聚合,内容和用户更容易形成强连接关系,也容易使得以往被忽视的用户“小众需求”被重现发现和满足。
2.3 数据新闻带来了新的权力中心
很多学者认为,数据新闻的产生从一定程度上打破了媒介权力的垄断,弱化了精英阶层对媒介新闻话语权的垄断,认为数据新闻是一种以客观数据为发现新闻线索的方式,在写作和表达的过程中是一种去除了传统固定采访路线和表现方式的新型模式,这种去除是对精英阶层在新闻生产中话语权的消解,是一种“去中心化”的新闻专业主义实践。
但是,“互联网+”时代,数据被称作为“石油”,由此可以看出来数据的重要战略资源地位。在我国,很明显许多调查新闻的数据源是被个别大型商业机构垄断的,是不可能被公开的,这就意味着,获取数据的高技术、高成本门槛其实将大多数的传统新闻机构拒之门外,媒体规模和资源成为媒体实践数据新闻的决定性因素。因此,具有数据生产能力的机构掌握了大部分用户的数据信息,只要想利用数据,就绕不开这些机构,长此以往,势必会形成新的权力中心。
另外,数据的产生过程本身也是一种更偏向于某种权力的过程。丽莎特曼在《原始数据只是一种修辞》所说,“数据从来不可能是原始存在的,因为它不是自然的产物,而是依照一个人的倾向和价值观被构建出来的。我们最初定下的采集数据的办法已经决定了数据将来以何种面貌呈现出来。数据分析的结果看似公正客观,其实价值选择贯穿了构建到解读的全过程”。作为个人而言,网络中的活跃分子和意见领袖们的意见更容易形成数据来源,而“沉默的大多数”容易被忽略,因此,数据的产生本身自带权力的偏向性。
因此,无论是作为机构还是个人本身,数据从被构建和发掘开始就已经带有了明显的权力中心特征。数据新闻生产方,要么是强势传统媒体,要么是网络巨头麾下为商业利益服务的互联网产品,由此可见,生产权力还是主要集中在少数机构和部分人手中,无论是从财力、技术手段还是数据的产生上,都是表面上的“去中心化”,实际上形成了新的权力中心。
3 数据新闻的反思
经过几年的发展,数据新闻的实践对新闻思维还是操作理念都做出了有益的补充,也激发了对传统新闻生产模式的更新和改造,在数据发掘的帮助下,媒体很容易从碎片化的信息发现规律和趋势,发现新闻要素的相关性,报道的广度和深度也得以加深,自然语言处理、机器学习、图像识别、神经网络等人工智能技术也将为数据新闻的生产提供更多的创新可能,数据新闻报道常态化的趋势已经异常明朗。
基于此,我们对于数据新闻可能带来的问题的反思也愈加重要。我们如何获得更全面、更客观的数据?如何补足数据新闻人情味欠缺的短板?数据新闻可视化的表达方式会不会带来新闻的过于简化?数据的生产过程和使用都对精英阶层更加友好,是否会加剧“数字鸿沟”?浓缩要点式的报道、新闻图表的直观表达、深度的解讀形式所带来的轻量化阅读体验,虽然符合我们现在的媒介使用习惯,但是长此以往会不会影响读者的思辨能力?根据用户需求提供的个性化定制新闻和推送新闻的大数据服务,虽然完成了传统大众传媒无法实现的“长尾内容”传播,发现了媒体新的商业增值点,但是会不会加重“信息茧房”?随着定位技术的发展,一方面是遗留于网络的信息更容易被他人所掌握,另一方面是公民对于个人权利重视意识也日益提升,信息公开与隐私保护矛盾该如何调和?如何更加充分发挥数据新闻的用户思维,即满足对用户信息获取需求的充分关注,对社会问题、社会趋势的准确揭示与深入剖析的要求,也能满足尊重用户,将用户纳入数据新闻的选题决策和生产体系中去的要求?
作为一种新的新闻生产实践,数据新闻将更多创新与潜能注入新闻业,数据新闻承载着新闻界的许多期待,也有更多的领域值得反思探讨。
相关文章!
  • 2017高校数字版权国际论坛在京

    2017年4月13日,中国文字著作权协会与美国版权结算中心在京联合举办“2017高校数字版权国际论坛”。来自国家版权局、教育部和世界知识产权

  • 突发事件网络舆情中的“塔西佗

    黄炎秋<br />
    【摘要】近些年,各种突发事件的网络舆情所产生的正面效应与负面效应同样明显,政府的公权力在面对公众高涨的舆论压力之时

  • “2017书香中国”全民阅读系列活

    在2017年4月23日世界读书日到来前夕,“2017书香中国”全民阅读系列活动启动仪式举行。国家新闻出版广电总局副局长吴尚之,湖南省委常委、