基于语音识别技术的广播智能化升级
周宇博
【摘要】基于语音的低接入属性、低注意力损耗、高情感陪护等,智能语音技术迅速崛起,成为当前主流的人机交互方式之一和万物互联的重要入口。在此背景下,立足声音传播的广播媒体迎来了生产优化、终端创新和交互变革的新机遇。结合自身优势,借助人工语音智能带来的技术红利,广播将有望实现生存战略的智能化升级、内容生产的智能化改造和受众价值的智能化提升,开启智能互联时代的发展新篇章。
【关键词】人工智能 智能语音 广播 万物互联
【中图分类号】G201 【文献标识码】A
近几年,人工智能(Artificial Intelligence,简称AI)的迅速发展深刻改变着人们的生活。所谓人工智能,就是计算机去做过去只有人才能做的工作(引自美国麻省理工学院Winston教授)。如同第一次工业革命实现了机器代替人类的部分体力劳动,人工智能技术实现了机器替代人类的部分脑力劳动,且这个替代部分还将越来越大。人工智能技术给不同终端装上“眼睛”“耳朵”甚至“大脑”,最终实现万物互联,因此受到各个层面的广泛重视。2017年7月,国务院发布《新一代人工智能发展规划》,将人工智能上升为国家战略,指出人工智能是引领未来发展的战略性技术,人工智能技术将会催生新产品、新产业、新业态、新模式,要推动人工智能与各行业融合创新。①
人工智能技术包含虹膜、手势、语音、图形识别及体感交互等不同方面,其中最为成熟的是语音识别。目前国际巨头公司谷歌、苹果以及国内的科大讯飞、百度等都正在以语音为入口,实现人工智能商业化应用。②
一、智能语音崛起的内在逻辑
无论从用户需求还是市场规模来看,智能语音都已进入发展的风口期。中国消费者使用语音助理的比例达55%,目前已有65%的中国消费者拥有搭载智能语音助手的產品。2016年中国语音服务市场规模达59亿元,比2011年增长了近1000%。③人工智能语音交互方式正在用“说话”这种最原始、最自然的方式潜移默化地改变着人们的生活。
(一)语音的低接入属性
大数据是智能的土壤,所有的智能都必须建立在数据的基础上。任何新技术的发展都需要在足够用户的不断使用中去完善和打磨。相较于虹膜识别、体感交互、手势识别等其他方式,语音技术的迅速发展主要得益于其低接入的属性。无论性别、学历、年龄,甚至是咿呀学语的稚童,都可以方便运用,低门槛性使语音交互更易获得大规模用户,从而促进技术的迅速发展,成为人工智能的第一入口。
大规模用户的不断使用推动语音识别的深度学习算法取得突破性进展。深度学习算法的卷积神经网络层级从最初的8层到19层、22层乃至152层的网络结构逐步加深,语音识别的错误率也从2012年的16%逐步下降到不足4%。④科大讯飞的讯飞输入法可以实现以1分钟400字的速度将语音转换成文字,识别准确率超过97%,其目前用户已经突破4亿人。实时语音不仅支持粤语、四川话、东北话、上海话、闽南话等19种方言的语音输入,还支持将中文演讲翻译成英语、日语、韩语等,并同步展示。⑤
(二)语音的低注意力损耗
信息时代,注意力成为一种稀缺资源。在这种情况下,竞争的焦点在于:如何减少注意力成本,或者说在投入有限注意力的情况下,使用户获得更多信息。低注意力损耗成为当前的一种重要优势和潜在商机。
语音的伴随属性恰恰可以满足这一要求。当双手和眼睛都无暇顾及的时候,语音成为最人性化、最有效的信息接收方式。语音互动不仅可以解放双手,还可以节约时间。目前,语音输入框正在逐渐取代键盘,减少人们在数据输入上花费的时间。
(三)语音的高情感陪伴
20世纪30年代,美国经济处于大萧条时期。为振奋民心,赢取人民对政府的支持,美国总统罗斯福在炉边通过广播同美国人民聊天。罗斯福认为这样的讲话可以免去官场那套排场,就像在家里和朋友交谈一样亲切自然。一如美国学者尼古拉斯·尼葛洛庞帝(Nicholas Negroponte)在《数字化生存》一书中指出:“声音渠道不仅传递信号,同时也传递了所有随之而来的理解、深思、同情或宽容。声音中潜藏了能唤起感觉的信息。”⑥
在当前的所谓“全民焦虑时代”,声音不仅能够传递文本信息,还能以文字所没有的温度传递情感信息。典型的声音媒体——广播,不仅是信息的提供者,也是听众精神的陪伴者。
二、智能语音加持下的广播新生机
从文字内容的语音化到语言交互的智能化,智能语音带给广播的有冲击也有生机。目前来看,智能语音为广播带来的机遇主要集中在三个方面:内容生产、终端创新、交互变革。
(一)智能语音技术搅动生产链条
音频内容生产效率的提高是人工智能为广播媒体带来的最直接利好。基于语音交互技术,机器正式进入媒体产品的生产链,新闻生产过程从过去单一的专业生产内容(Professional Generated Content,简称PGC)变成专业生产内容+机器生产内容(Machine-generated Content,简称MGC)。
MGC可以通过“开源”和“深挖”贡献大量的内容增量并提高生产效率。开源方面,MGC既可以从大量音频素材中甄选出适合广播的内容,也可以从文字素材中转化出适合广播播出的音频。深挖方面,MGC的运用大大提高了音频内容的生产效率。过去一个小时的广播节目,若想碎片化处理,精选出十几分钟的节目,需要人工一点一点去收听、去截取。如今利用人工智能技术,通过关键词搜索,可实现快速拆条编辑。同时,语音识别和转换也让广播的内容传播不再受限于声音介质。在人工智能技术可实时、持续将语音转换成文字的情况下,语音产品可打通各个端口,进一步推动媒介融合的进程。
(二)智能语音硬件掀起终端革命
过去,大众接收信息的终端有纸张、收音机、电视机、电脑、手机等,而随着智能语音技术的逐渐成熟和广泛应用,一些新的信息终端应运而生。
以智能音箱为核心代表的智慧家居硬件前景光明。从亚马逊的“Echo”、谷歌的“Google Home”,到苹果的“HomePod”、阿里巴巴的天猫精灵、京东的“叮咚”……智能音箱只是这场终端革命的预热。未来,“家居场景中,智能电视、智能冰箱甚至智能镜子等设备都可搭载语音助手,实现语音控制,串联起从厨房、客厅到起居室、卫生间的智慧家居物联网”⑦。
智能可穿戴设备也是颇具潜力的市场。智能手环、智能手表、智能眼镜等已进入大众生活。据国际数据公司(IDC)预计,整个可穿戴设备市场的出货量将从2018年的1.132亿件增加到2021年的约2.223亿件,前景无限。⑧目前,笔记本电脑、平板电脑、手机都实现了内置智能语音助手,未来,将智能语音交互技术融合到便携可穿戴设备中,对两者的发展来说是“双赢”的。
除了像智能音箱、智能可穿戴设备这样的“新”终端,智能语音技术也可使一些现有终端呈现新的生机。例如:语音交互技术进入传统车载场景后,驾驶员的新闻获取、娱乐休闲、路况获取、路线导航等需求均可由语音助手完成,这将使车载终端焕然一新。
(三)智能语音交互刷新用户体验
智能语音为媒介信息生产、传播带来巨变,但它所引发的最具“颠覆性”的改变是交互方式的革命。
过去,人们依靠触摸屏幕完成交互,在智能语音的助力下,机器将能听懂并执行人的语音指令。英国Fjord集团设计师安迪·古德曼(Andy Goodman)将用户不通过点击或触摸来获取信息的行为称为“零用户界面”(Zero user interface),其最大特点是摆脱屏幕限制的思维模式,信息的接收和处理主要依靠语音来完成操作,在操作过程中,用户只需记住驱动智能设备的口令。⑨
目前,我国的大部分终端仍处于从触摸屏交互到语音界面(Voice interface)交互的过渡阶段,但已然可以感受到智能语音技术所带来的崭新交互体验:2017年6月,由香港科技公司Hanson Robotics设计制造的人工智能机器人“索菲亚”(Sophia)加入英国《早安英国》节目组,成为一名机器人主播;2018年全国两会期间,湖南广播电视台广播传媒中心与科大讯飞组建的“听说”联合实验室专门订制研发“AI新闻主播系统”,由人工智能虚拟主播播报的新闻在湖南《全省新闻联播》中发声,解读政府工作报告。未来,更广阔的交互场景、更多样的交互体验必将一一呈现。
三、以语音为内核的广播智能化发展
伴随着人工智能技术的发展,以音频识别、语音交互等为代表的智能语音技术为广播媒体转型升级和未来发展注入强大动力,提供了更富革命性的方案和更加广阔的想象空间。
(一)广播生存战略的智能化升级
“广播+智能”让音频产品看到了新的曙光,如今,智能语音已被视为媒体走向万物互联的应用重点和发展风口。未来,语音交互技术所构建的不仅仅是声音传递的通道,更是信息交换的关口。在这种情况下,广播媒体应思考的远不止如何通过技术升级实现自身发展,应该还有如何运用自身在语音领域的技术优势和数据积累,成为智能生态的重要一环。
在未来音频行业的生态中,广播媒体是信息尤其是新闻内容的供应者。美国国家公共电台(National Public Radio,简称NPR)与爱迪生研究机构(Edison Research)于2018年7月联合发布的《2018智能音箱报告》数据显示:73%的智能音箱使用者把“新闻时事”作为他们最感兴趣的话题,在打算购买另一台智能音箱的智能扬声器所有者中,有60%的人是为了在家里更多的房间里听新闻。由此可见,听新闻是智能音频的主要推动力。对于广播媒体而言,音频新闻生产是其目前最核心的竞争力,未来的首要目标是如何与各种终端相结合,把自身打造成音频生态中稳定的供应商。
广播媒体的另一个优势是丰富的语音样本。人工智能并不是天生聪明,而是需要基于大量数据库的学习。在这种情况下,广播媒体实现智能化转型的另一个基础工作和发展机遇就是将其在音频领域的积累数据化,进而和领先的技术研发者合作,在自己的“土壤”中,让人工智能更加“聪明”地服务于下一步的转型发展。
(二)广播内容生产的智能化改造
1.引入机器生产,激发生产活力
对广播来说,人工智能的首要影响是技术进步对采编效率的提升。基于语音识别技术的语音转写平台可以代替记者手动整理录音的方式,节约时间成本,“智能文稿唱词系统”甚至可实现语音文本同步编辑;采用语音识别技术,通过预置禁忌词的审听系统,可提高节目审听效率;基于语音检索、智能拆条等技术,可实现媒资平台智能化,提高媒资内容的检索效率和检索精度;借助智能语音翻译助手,将提高外语类节目的制作效率,为国际传播提供助力。在音频内容供应的数量和质量都显露出极大提升潜力的情况下,一旦广播媒体将“智能”因子嵌入采编流程,供给升级的“潜力”变为“能力”将成为现实。
对广播来说,人工智能更为核心和广阔的应用领域是个性化语音合成。这不仅仅是让文字“发声”,还要发出个性化声音。2018年7月,我国推出的一款语音微信小程序,只需采集10句声音,便可实现个人声音复刻,致力于帮助用户打造自己的专属音库。通过个性化语音合成的方式打造个性化声音品牌资产,并实现在车载导航、游戏娱乐、智能家居等生活领域的应用,这为智能时代的广播交互留下无限遐想。
2.抓住技术红利,拓展应用场景
人工智能的第二个影响是机器人主播的出现和运用。相较于积累、学识都存在着一定局限性的主持人,在数据库的支撑下,人工智能机器人能很好地解决广播主持人知识储备不足、口播易出差错、大數据处理效率不高等问题。目前在广播领域运用广泛的微软“小冰”,最开始能精准播报天气预报、路况信息、新闻资讯,到能自主操控对话,生成有声少儿读物、新闻、评论;接着可以实时利用大数据梳理热点话题、搜集网友评论、全程与人类主持人互动;如今已能逐渐融入情感与智商主持节目。
经过数次迭代,“小冰”已从一个人工智能对话机器人发展成为以情感计算为核心的完整人工智能框架。在广播电视领域,“小冰”以“人工智能主播”的身份通过人工智能技术参与生产与主持的广播电台节目已达28档。⑩虽然从实际应用来看,机器人主播还很难实现人工主持人陪伴、交流的功能,但是在各类服务场景中,机器人主播的红利已经显现。未来如何为已有的应用场景提供更好的音频服务,如何通过发现新的场景来引领智能音频的发展,是广播智能化转型的必修课。
(三)广播受众价值的智能化提升
当前传统广播,面临着受众老龄化以及由此引发的传播能力萎缩和广告价值下降的困局。相较而言,智能语音的用户则更加年轻。以目前智能语音落地的主要产品——智能音箱为例,易观发布的《中国智能音箱产业发展分析2017》数据显示:智能音箱用户集中在26~35岁人群,占比约45%;55岁及以上的用户占比不足10%。不仅如此,《2018智能音箱报告》数据显示:73%有孩子的受访者表示孩子会在家使用智能音箱,25%的受访者表示智能音箱可以辅导孩子家庭作业,60%的受访者表示智能音箱使孩子的娱乐生活更便捷、丰富。由此可见,在智能音箱的使用方面,孩子成为一股不可忽视的力量。孩子在家使用智能音箱的比例以及智能音箱在孩子的教育、娱乐等方面所发挥的重要功能都启发我们:作为一种智能硬件,智能音箱与特定内容(如亲子类内容)相结合,也许有望开辟一片未来的收听蓝海。
如果广播媒体能够在智能语音这个大生态中占有一席之地,完成智能化的转型升级,将有望实现“弯道超车”,优化受众年龄结构,提升受众价值。更为关键的是,随着时间的推移,年轻人逐渐成长,智能语音应用可逐渐成为覆盖全年龄段的产品。
总之,人工语音智能为声音带来了无限可能,声音除了具备传递信息、表达情感、沟通心灵的功能以外,本身亦成为一种信息、一种应用、一种操作系统,成为人机协作、人机共生的重要渠道。广播媒体只要坚守“声音”阵地,借人工智能技术的东风,必能直挂云帆济沧海。未来将是“广播+人工智能”的美妙世界。
注释
①《新一代人工智能发展规划》,中国政府网,http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm.
②牛禄青:《智能语音开启人机交互新时代》,《新经济导刊》,2017年1~2期合刊。
③唐绪军:《新媒体蓝皮书:中国新媒体发展报告No.9(2018)》,社会科学文献出版社,2018年版,第95~97页。
④闻立群、刘珊、董明芳:《智能语音助手将成为新的用户入口》,《现代电信科技》,2017年第1期。
⑤《升级中国直播间 :语音黑科技让生活更智能》,新浪新闻 GOODTECH 系列直播,http://live.sina.com.cn/zt/l/v/news/znyy/.
⑥〔美〕尼古拉·尼葛洛庞帝:《数字化生存》,胡泳、范海燕译,电子工业出版社,2017年版,第144页。
⑦李清宙:《智能语音交互技术在媒体的应用和前景》,传媒评论,http://www.sohu.com/a/238061179_644338,访问日期:2018年6月27日。
⑧《法媒:国际数据公司预计可穿戴设备市场前景不错》,参考消息,http://baijiahao.baidu.com/s?id=1587727260413151998𝔴=spider&for;=pc.
⑨ 张建中:《声音作为下一个平台: 智能语音新闻报道的创新与实践》,《现代传播》,2018年第1期。
尹琨:《微软小冰全面“涉足”新闻出版广电领域》,中国新闻出版网,http://www.xinhuanet.com/zgjx/2018-08/03/c_137365537.htm.
易觀智库:《中国智能音箱产业发展分析2017》,搜狐网,http://www.sohu.com/a/162228785_99958508.
(本文编辑:肖婧为)