人工智能技术与学术和专业出版的融合发展

【摘 要】 文章从背景、研究方法、数据分析、实践应用方面对如何建立面向知识服务应用的人工智能研究进行了系统剖析,并对多种人工智能技术与学术内容、专业内容的融合方法进行了深入论述。通过对Yewno、沃森医生、德勤小勤人三个案例的解析,介绍了知识图谱技术的行业应用方式,以及如何利用专业内容,形成服务社会的人工智能应用。
【关 键 词】人工智能;学术和专业出版;知识服务;融合
【作者单位】孙赫男,北京印刷学院,北京英捷特数字出版技术有限公司。
【中图分类号】G230 【文献标识码】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2018.07.010
人工智能是使用机器代替人类实现集认知、识别、分析、决策等功能于一身目标的多学科技术,其本质是对人类意识与思维信息过程的模拟。在2017年7月国务院发布的《新一代人工智能发展规划》中,知识计算引擎和知识服务技术被列为“关键共性技术体系”,并且这个规划提出要“重点突破知识加工、审读搜索和可视交互核心技术,实现对知识持续增量的自动获取”。这为学术出版和专业出版带来了进一步与人工智能技术结合从而实现产业融合发展的良好契机。
一、学术和专业出版与人工智能技术结合的先天优势
学术和专业出版行业作为内容生产者、知识服务者,拥有能够突破人工智能学习能力的海量内容数据,这些数据,内容关联性已经建立、市场需求明确、客户群体精准,在人工智能技术应用上享有得天独厚的优势。学术出版和专业出版商,有望率先实现人工智能时代创新型知识服务商的转型,为出版业迈入知识服务时代提供典型案例,进而为文化创意产业与人工智能技术融合开辟路径。关注和研究人工智能的发展趋势及现状,应用人工智能技术促进学术和专业出版的创新型知识服务发展,探索学术和专业出版知识服务的实现路径及发展战略,有利于提升我国学术传播手段和路径,扩大学术传播范围,创新学术传播方式,提升中国学术影响力,对全国相关数字出版企业的发展也将起到一定的引领和指导作用。
从宏观层面研究来看,国内对于知识服务的研究主要基于知识服务的观念和方式两个角度,对知识服务的特点和本质进行研究与分析。王晓光在《人工智能与出版的未来》中提出,知识是连接出版与人工智能的重要概念,随着蕴含知识的出版内容逐渐数字化和可计算化,人工智能与出版之间的相互作用日益强烈。张淑雅等人在《关于出版企业知识服务模式的思考》中认为出版业的知识服务是广义的知识服务,即基于数字技术提供系统化知识的服务。出版企业向知识服务提供商转型存在可能性和必要性,一方面是由于国家政策的扶持和现代数字技术的驱动,另一方面源于信息时代对出版企业提出的要求。在转型过程中,不同出版企业选择路径不同。孙晓翠在《“企业2. 0时代”出版企业向知识服务提供商的转型升级模式》中认为主要有内容服务型、科技服务型和平台服务型三种发展模式。张新新、刘华东以《新一代人工智能发展规划》为视角,指出在人工智能时代,出版流程在群体智能理念指导下进行再造,数据成为出版生产要素,AR/VR智能出版、智能教育等智能化方向成为崭新形态。从微观层面研究来看,国内学者侧重从内容生产、内容编辑、内容发行传播等方面探讨人工智能对出版各环节产生的影响。宋宁远在《面向智慧数据的科学知识图谱构建——以Sci Graph为例》中通过分析斯普林格· 自然集团的Sci Graph项目,提出知识图谱作为智慧数据的表现形式之一,是人工智能在专业出版领域应用的基础。
综上所述,与出版产业结合的人工智能研究主要集中在自然语言处理、深度学习、专家系统领域,涉及知识的生产、表现和传播。学者普遍认为人工智能技术和出版产业的深度结合是出版业未来发展的必然趋势。
二、如何建立面向知识服务应用的人工智能研究
人工智能技术的迅猛发展让行业的先行者立足于文化与科技产业融合的发展大背景,密切跟踪行业需求和实践,针对人工智能技术进行应用研究,通过研究访谈、数据采集、文献整理、技术路线分析,对学术和专业出版社如何应用人工智能技术提供创新型知识服务做现状总结,并对这个领域的未来发展趋势进行预测。
学术和专业出版领域不断涌现各种创新型服务案例,目前学界和业界对于这些案例的总结和研究还非常有限。那么,如何建立面向知识服务应用的人工智能研究呢?
首先,要进行背景分析。要对国内外与推动人工智能发展相关的内部环境和外部环境进行分析,分析人工智能在全球范围内各领域受到广泛关注的内在原因和外在原因,对相关政策进行梳理总结。人工智能、大数据以及数字出版具有各自的研究发展脉络,而创新型知识服务是这三条分别发展的主线的融合体现。出版行业作为知识传播的主力军,对新技术特别是传播技术的吸收应用一直走在社会各行业的前列。学术和专业出版是最早完成数字出版转型的领域,通过创新型知识服务,将数字出版积累的数据资源与人工智能技术结合,挖掘更大的知识价值,服务更广泛的受众群体。
其次,要结合图书馆情报学的理论研究,分析学术和专业出版的主要市场,从满足需求的角度,对目前知识服务的主要服务对象、服务方式进行梳理。学术和专业出版的内容是具有高度规律性的内容,是具有显著结构化特征的非结构化数据,对其进行规律总结可以形成知识服务技术产品。目前,在国家新闻出版广电总局的知识服务工程中,主要的学术和专业出版机构都建立了知识服务工程的示范项目,因此,需要对已经形成的知识服务技术体系进行总结描述,这是人工智能技术实现行业应用的基础。
再次,要重点关注对数据的分析。如何突破目前出版行业推动人工智能发展的瓶颈,关键在于数据。数据是驱动人工智能发展的关键元素,知识数据体系构建的成功与否,决定是否能够真正产生人工智能技术应用。这里包含四个层面的内容,一是知识数据的采集,即如何实现自身数据、合作数据、外部数据的聚合和清洗,形成统一的数据标准,从而降低后续数据工作的成本。二是如何對已经采集的数据进行机器友好的标引,建立知识工人的标准工作方法和流程,形成具有可支持人工智能的细颗粒度标引,支持知识引擎的运行。三是知识引擎的构建方式,即如何开发知识引擎的自我学习能力。目前已经形成了不同的方法,但仍然不够完善,如何形成优势互补的方案,亟待研究。四是知识更新的方案,必须建立稳定的数据更新机制,才能保证知识的准确性、知识更新的及时性,以及知识数据的价值。
需要意识到的现实是,虽然有国家政策明确指引人工智能技术与具体行业融合,人工智能技术将从根本上改变出版内容生产、编辑、发行、传播等环节,推动出版业态重构升级,但人工智能技术的应用仍处于探索阶段,实现成熟的出版业智能化市场应用仍需假以时日。目前,业界研究者注意到人工智能部分应用还未能产生经济效益,对于人工智能技术对出版业影响的研究探讨,仍集中于基本理论、基本概念、产业政策和重要意义等宏观层面,人工智能技术投入实践应用的案例研究缺位。
三、从Yewno看知识服务模式创新
Yewno是由Ruggero Gramatica于2014年创建的一家美国公司。创始人是经济物理学的研究学者,他利用物理学派产生的数据结构来描述经济和金融周期,然后将数据框架应用于其他复杂领域。其在知识服务模式创新方面,有几点创新值得借鉴。
第一,对知识节点的挖掘。Yewno的核心理念是对知识节点的挖掘,并且将知识节点的关联应用到了许多不同的学科,服务于教育和出版领域。Yewno为教育领域提供Yewno Discover服务,让高中生和大学生可以很容易地发现知识的内在关联,并且从知识节点直接关联到相关的内容资源,节省了学生做研究论文题目的时间。Yewno为出版领域提供的Yewno Unearth服务,可以让学术和专业出版机构建立自己的知识图谱,将出版物内容关联至知识图谱中,并且可以让各个垂直的知识图谱形成独立的出版物和数据库,提高了出版素材的价值。通过两种产品的有效联结,知识节点的使用者和知识节点的创造者实现了连通,加强了知识节点的准确性和有效性。
第二,形成非常细颗粒度的知识结构。Yewno为出版商提供的Yewno Unearch主要应用了语义计算技术和机器学习算法,将出版物的每个单独部分进行处理后,形成了非常细颗粒度的知识结构,极大超越了目前的分类法和标签体系,而这种细致的颗粒度,又推进了Yewno Discover用户对信息的使用。
第三,基于对信息的摘要性理解,以及对知识的可视化提供研发产品。Yewno的所有技術产品都是基于对信息的摘要性理解,以及对知识的可视化提供研发的。每个学科和产品,都拥有特定的语料库和机器学习算法,以保证对内容的准确理解。Yewno的技术产品还通过产品的相互配合,形成了对任何领域信息的理解能力。
Yewno公司给我们探索人工智能技术驱动下的知识服务模式提供了非常好的案例示范。自然语言理解技术和机器学习技术的结合,产生了人工智能技术驱动下的知识图谱。但是对知识图谱的应用,如果只局限在出版行业的生产环节,会失去用户刺激下的智能提升可能,如果只用于面向用户的内容显示,则会失去数据产生的源头。Yewno的产品设计,恰恰形成了数据的良性增量和不断反馈的训练过程。Yewno的知识服务模式创新,值得国内出版业界研究和借鉴。
四、人工智能技术应用于知识服务的瓶颈突破
人工智能技术应用于知识服务,必须解决从非结构化数据中形成对知识的挖掘和总结这一难点,才能让机器更好地理解内容,形成持续提高知识理解力的训练过程。然而现实中,知识在内容中的分布还是缺乏规律性。学术内容和专业内容,由于有学科知识结构和专业语料库的支持,机器可以通过关键词搜索、词义距离计算、知识结构树这些辅助要素,形成对内容的判断。特别是学术期刊,作者提供的摘要、关键词和参考文献可以对机器学习起到支撑作用,机器还可以将学术期刊内容作为智能计算结果的对比参照物。这些都有助于机器突破人工智能学习能力瓶颈,提高智能化水平。
可以说,学术和专业出版不仅是人工智能技术的应用方,也是人工智能的智能源。通过对学术和专业出版高质量内容的结构化解析和关联,将成果应用于各行各业的人工智能大脑,可以让人工智能获得更丰富的专业知识,更好地为人类服务。比如IBM的机器人——沃森医生。沃森医生通过对数十万医学类图书、期刊文章的学习,可以综合掌握医疗知识;通过对十几万病例的学习,不仅成功通过了医生执业考试,还能够给出与副主任级别医生几乎完全相同的诊断和治疗意见。由于机器之间的快速联通性,往往病人还没走出造影室,沃森医生就已经根据收到的扫描仪信息,给出了诊疗意见。目前沃森医生已经开始为多家大型医院提供诊疗意见,通过与人类医生的意见对比,保持持续的智能训练。又如德勤会计师事务所的小勤人会计机器人。它通过了会计师考试,可以完全取代初级和中级会计的工作,将账目的整理、审校环节完全自动化,减少了大量文案工作。而且小勤人会计机器人不需要软件就可以完成工作,速度快、效率高、差错率低,可以解决会计年底年初工作量超负荷的现实问题。
综上所述,内容服务产业链主要包括内容生产、内容传播及用户体验三大环节,在每一个环节,又有不同的角色参与其中,这为人工智能技术在很多环节的应用提供了可能。研究发现,目前可见的人工智能技术行业应用既包括科技内容智能出版体系等定制行业应用案例,也包括智慧机器人、科研助手(如Sci Graph)、行业服务(如IBM的沃森医生)、教育服务、数据出版等行业应用产品或服务。未来,人工智能技术的行业应用前景将更为广阔。
大多数案例的开放界面为前台使用界面,研究人员需要提升对人工智能多类别应用技术的理解力,从可见的应用界面入手,梳理其背后的技术脉络,对人工智能技术驱动的技术方法进行具有可操作性的总结再现。因此,行业迫切需要掌握出版行业、计算机信息技术、图书情报学涉及的学科基础知识,能够从生产、实现、使用的不同环节,对人工智能技术驱动下的创新型知识服务模式做深入剖析的研究人员,共同捕捉人工智能技术在国内外学术和专业出版领域的应用实例,洞悉人工智能技术如何形成创新驱动力,推进人工智能技术与学术和专业出版的深入融合。
|参考文献|
[1]王晓光. 人工智能与出版的未来[J]. 科技与出版,2017(11).
[2]张淑雅,杜恩龙. 关于出版企业知识服务模式的思考[J]. 出版广角,2017(7).
[3]宋宁远,王晓光. 增强型出版物模型比较分析[J]. 中国科技期刊研究,2017(7).
[4]孙晓翠. “企业2. 0”时代出版企业向知识服务提供商的转型升级模式[J]. 出版发行研究,2017(8).
[5]宋宁远. 面向智慧数据的科学知识图谱构建——以Sci Graph为例[J]. 科技与出版,2017(11).
[6]张新新,刘华东. 出版+人工智能:未来出版的新模式与新形态——以《新一代人工智能发展规划》为视角[J]. 科技与出版,2017(11).
[7]段弘毅. 数据驱动的机器智能叙事——以NarrativeSci-
ence为例[J]. 科技与出版,2017(11).
[8]官思发. 大数据知识服务关键要素与实现模型研究[J]. 情报资料工作,2013(2).
[9]许剑颖. 数字出版知识服务的内涵、模式及对策[J]. 科技与出版,2017(11).
[10]曹沁颖. 人工智能对出版业的影响及应对浅析[J]. 科技与出版,2017(11).
相关文章!
  • 新常态背景下供给结构转型的逻

    【摘要】吴敬琏等学者编著的《供给侧改革》一书,选题切合时代需求,研究视野宏阔,求真务实且见解独到,弘扬了改革创新的时代精神,具有强烈

  • 电视剧《西藏秘密》的史诗性

    王泉<br />
    根据刘德濒同名小说改编的46集电视连续剧《西藏秘密》,以僧人扎西顿珠的沧桑人生经历为线索,真实再现了20世纪30至50年代末

  • 个性打造精品特色塑造名牌

    陈 雪<br />
    【摘要】时下,收看电视新闻评论节目,成为观众更深层次了解新闻的热门途径。迄今,CCTV4套《海峡两岸》已成为一档优秀的电视新