网站首页  词典首页

请输入您要查询的论文:

 

标题 如何看待大数据热
范文

    匡文波

    大数据重构了传媒行业,成为当下的热点话题。然而,大数据却不是万能的,存在种种问题和隐患,需要人们对其进行理性对待。

    一、大数据是绝大多数媒体人的弱项

    今年5月,我在北京做了一个针对媒体从业人员及高校新闻传播院系教师的500人规模的问卷调查,有效回收问卷353份。我发现,高达85.55%的被访者只是知道大数据这个名词,只有7.08%的被访者知道大数据的概念和特征,1.98%的被访者知道大数据技术所涉及的软件。然而,还有5.39%的被访者竟然完全不知道大数据,包括不知道这个名词。

    究其原因,一是与我国的新闻传播学教育有关,在我国几乎所有高校的新闻传播院系都是所谓的文科,开设的技术课程十分有限。二是中国的传统媒体从业人员,技术出身的人所占比例偏低,绝大多数是所谓的文科出身。

    对于新闻传播学的研究者而言,存在同样的问题。在小数据时代,由于技术手段有限,人们只能采用抽样的调查方法对事物进行分析,并将局部的研究结果延伸至总体,传统的电话调查、拦截面访等新闻传播学的研究方法是基于这个原理展开的。然而,每一种抽样方法都存在一定不足,难以反映总体样本的全貌,因此,调查人员一般会增加抽样的数量,以提高统计的精确度,但这也意味着调查成本的增加。大数据的确具有不可替代的优势,但就此认为一种新兴的技术将完全取代千百年积累下来的科学发展成果,这无疑走进了大数据自大的怪圈。随着大数据的不断发展,越来越多的实例证明,全数据分析具有不可替代优势的梦想在现实中无法实现,大数据只能对传统的新闻传播调研方法进行补充,却无法取而代之。传统科研方法经历了长时间的学术沉淀,具有较强的逻辑性、科学性和规范性,这是新诞生的大数据研究方法难以相比的。

    二、过分依赖大数据容易出现假发现

    大数据是客观存在的,却无法进行自我处理和分析,需要人对其进行进一步解释和分析。在这个过程中,人为主观性将可能导致事实客观性的偏颇,进而产生对新闻客观性的挑战。有美国学者指出,人们在翻译数据信息时存有偏见……记者群体容易滥用因果推理逻辑或相关性分析{1}。记者群体的轻易归因,容易导致许多“假规律”的产生,反而让人难以发现事件背后的真正规律和问题。

    大数据分析更多的不在于对事情因果关系的分析,而是对其相关性的体现,进而对未来发展趋势做出预测,并最终进行决策判断。比如:通过用户数据的反馈,程序化广告系统发现某用户近来多次浏览某一品牌厂商的广告,因此判断他有可能购买该产品,并进而对该用户进行更大力度的宣传。这种“人工智能”看似神奇,但也可能会导致许多机械性结果和决策的产生。在进行某项决策时,人类会综合多种因素,包括联系前后情景,感性、理性双重的作用等,最终形成判断,这是人脑如此发达的原因。显然,没有情感的机器无法做到这一点,许多通过算法自动生成的预测和决策都具有一定的机械性。

    大数据分析有可能带来歧视。2016年年初,百度大数据推出中国偏见地图,这可能造成人们对某一地区、族群刻板印象的加深。比如:河南人都是骗子,广东人什么都吃,新疆人多为小偷等。这种刻板印象将可能造成现实生活中职业歧视、司法歧视、婚姻歧视等一系列歧视问题的发生。

    三、基于大数据技术的机器人容易产生冰冷的新闻

    机器人写新闻的技术基础是大数据技术。

    2015年年末,许多媒体机构传出机器人代替记者写稿的消息,例如:新华社迎来一位“机器人记者”——“快笔小新”,腾讯财经使用“Dreamwriter”写稿,能在第一时间运用算法生成新闻稿件,这些都让人感叹“记者即将下岗”。技术的进步加快了生产力的发展,“机器人写稿”虽好,但却缺少“温度”。虽然大数据看似解决了新闻客观性问题,但新闻的角度同样重要。新闻是“有温度”的,它嵌入记者的思考,倡导一种理念,体现人文关怀。然而,机器人“记者”却只能“冷冰冰”地将数据中反映的事实全盘托出,难以体现人文精神。而且,机器人难以做到归因、举证,因此无法引导人们对某一则新闻的深入思考。由于机器人是根据特定算法生成稿件的,没有加入记者的个性,千篇一律,长此以往,容易令人厌倦。

    当前新闻写作软件只能生成特定类型的报道,且只能采用单一来源的数据,遵循这类报道常用的固定模式,大批量“生产”出有限类别的短新闻。具体的生产过程是机器人中固化的软件事先被设定了算法,通过软件整理数据事实,并与历史数据和其他背景信息相结合,再遣词造句呈现出描述性的新闻。因此,机器人撰写报道就如同做填空题一样,只需要在设定好的语境中进行简单的填充即可。虽然现今这类写作软件变得更加“聪明”,算法更加先进,如将读者喜好的语气、角度甚至幽默融入一篇报道之中。以机器人报道篮球赛事为例,可能机器人会用同样的数据生成两个版本的新闻:一个版本为获胜球队的粉丝所写,一种欢天喜地的气氛;另一个版本则是为失败的球队准备的,读起来让粉丝沮丧低落。但无论如何,机器人无法理解两个球队所有粉丝的感受,因为并不是获胜就完全满足,可能球队通过比赛还是反映出存在的一些问题;而失败的也不一定完全是失落的,因为他们也许看到了同强队交手中显示出来的球队进步。因此,机器人是无法同创造力旺盛、想象力丰富的人类作者相比拟的。

    作为面向普罗大众的新闻媒体,要增强新闻宣传和舆论引导的吸引力、感染力、亲和力和影响力,就必须采制出有现场温度及人情温度的报道内容。当然,评判一条新闻的质量好坏有多重标准,但真正能打动受众的往往是有温度的新闻。新闻的温度源于媒体人的社会责任感,源于媒体人对普通受众的感情积累。做新闻不能只站在媒体的角度来反映民众的生活,更重要的是在情感上实现与受众的相互交融。

    美国西北大学研发了新一代智能写作软件Narrative Science,宣称将新闻报道和大数据技术进行了一次新时代的结合,这款软件通过对给定主题的数据分析,能够自动地选择合适的写作角度,快速完成一篇具有标准新闻报道结构的文章。虽然在新闻报道中自动增加了一些形容词以提高可读性,但写出来的文章依然明显缺乏新闻温度。这是因为机器本身没有办法判断情绪,它们只是单纯地从数据库中抽取形容词,用法正确与否暂且不论,但与“手工打造”的饱含情感、责任和人文诸因素的新闻稿相比,从机器人手中传递出来的新闻虽然是新鲜的却是冰凉的。

    四、依赖大数据技术容易使人缺失新闻敏感度

    通过新闻敏感度,不但能够对新闻从业者的采写能力进行判定,同时也能对新闻价值进行判定。新闻实践是新闻从业者职业新鲜感、新闻写作创新感的体现,在新闻实践过程中,如新闻敏感度缺失,则直接降低了新闻价值。一个具备很强新闻敏感度的新闻从业者,可以从平凡的事件中发现有价值的新闻,从很小的细节中洞见真实和深度,从而挖掘出有价值的新闻;而新闻敏感度较弱的新闻从业者,则会存在漠视现象和反应迟钝的问题,从而与有新闻价值的线索擦肩而过,错失好的新闻题材。

    机器人将数据直接转化为文章其价格较为低廉,因此机器人可用以提供对不同读者的新闻定制服务。但是,基于大数据技术的机器人写新闻,存在新闻敏感度缺失的问题,机器毕竟是机器,尽管美联社表示机器人写作软件按照程序使用不同语气的能力越来越强,但新闻毕竟出自机器人之手,它不具备对新闻线索进行挖掘的观察能力,也不具备对新闻事件进行取舍的决断能力,而这两种能力是新闻敏感度的重要体现。

    就机器人撰写新闻的过程而言,一些具有固定模式的行业性文章更符合它的本能,因为既不需炼字锻句,又不需深度分析。如果有一天记者真的被冷冰冰的机器人取代,新闻恐将沦为诸多报道模式的生硬“拼盘”。人们很难期望机器人会像人类一样,能够根据不同的采访对象,变换不同的采访语气与被访者进行观点和思维的交锋。因此,我们在认可机器人存在技术上的优势之外,也承认机器人是无法同人类一样具有足够的应变能力和创造能力的。

    美国《大西洋月刊》网站报道称,自动写作软件目前最擅长的领域是体育和金融,因为这些领域的一些报道本来就已经很“机械化”。

    人类的思维至少在短时间内无法被机器人模仿,分析和观点性的报道需要消息来源、知识积累、逻辑思维等众多的能力在里面,在这些方面,机器人写手无法与记者一决高下。通过机器人撰写的稿件,会因为内容的生硬和重复而影响稿件的质量。“机器人记者”能写的文章种类有限,无法进行深度分析,更不会炼字锻句。

    记者工作是一种复杂的、高级的脑力劳动。机器人也是人类发明的。机器人的构思再精巧,也无法替代人脑。机器人抢不走记者的饭碗。

    人们不能指望机器人在镜头前随机应变或深入背街小巷明察暗访。新闻作为一种文字和图像的艺术,字里行间与镜头之下,都包含着记者的判断、价值观与人文关怀。机器人写手虽有其技术优势,但却无法完全具备人的灵活性和创造力。

    显然,机器人写手只是一种辅助形式,它可以节省时间,把记者从一堆基础数据和信息中解放出来。

    总之,对于大数据技术,以及衍生出来的机器人写新闻,我们要理性、客观地对待,不必人云亦云。作为媒体人,既要积极学习吸收新技术,也不必自卑自弃。

    注释:

    {1}Toby Segaran、 Jeff Hammerbacher.Beautiful Data: The Stories Behind Elegant Data Solutions,O'Reilly Media,2009年7月,第1版,205-211

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/10 17:05:36