人工智能提升图书阅读效率策略研究

【摘 要】我国国民阅读量偏低是一个引起广泛关注的问题。本文探讨了利用人工智能来提高图书阅读效率的策略,在总结当前提高图书阅读效率途径的基础上,提出了以阅读心理学原理为依据,以知识图谱为基础,以语音等技术为手段的阅读效率提升策略,并在阅读前材料选择、阅读时信息加工和阅读后知识利用三个阶段分别提出了若干辅助措施。
【关 键 词】图书阅读;人工智能;策略
【作者单位】严志永,北京印刷学院。
【基金项目】北京市社会科学基金研究基地项目(16JDXCC007)。
【中图分类号】G202 【文献标识码】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2018.01.004
我国国民阅读量一直偏低,这引起了政府、业界和学界的关注。根据第十四次全国国民阅读调查报告,2016年,我国成年国民人均阅读7.86本书,其中纸质书的阅读量仅为4.65本,电子书的阅读量为3.21本[1]。2017年上半年,国务院法制办审议通过了《全民阅读促进条例(草案)》[2],体现了我国政府积极推动国民阅读活动的决心。出版企业推出了大量介绍阅读方法的图书,并大力推广数字阅读。学界则对这些举措的效果进行了及时的调查研究。
根据公式“阅读量=阅读时间×阅读速度”,相关机构在提高读者阅读时间成效不显著的情况下,可以考虑从提高阅读速度入手来提高国民的阅读量。美国阅读专家施道弗提出了阅读效率公式,即“阅读效率=阅读速度×理解率”。他认为阅读应该在追求快速阅读的情况下保持较高的理解率,即阅读效率。近几年,人工智能在语音、图像等多个领域中的应用成效显著,是一项值得出版业关注的新技术。本文拟对人工智能提升图书阅读效率的策略进行探讨。
一、提高阅读效率的现状
本文按照时间顺序将图书阅读过程分为阅读前材料选择、阅读时信息加工和阅读后知识利用三个阶段,并从这三个阶段来分析当下提高图书阅读效率的主要途径。在阅读前材料选择上,一个提高阅读效率的重要途径就是图书的自动推荐,电商的商品推荐系统一般具有这项功能,即根据读者在电商网站上的图书浏览和购买记录来自动为读者推荐图书。数字阅读APP也集成了图书推荐功能,会根据读者的阅读记录为读者推荐图书。当前,人们完整阅读一本书的情况越来越少,因此,相关机构根据读者的需要仅向读者推荐图书的某些章节就变得很有必要了。目前,已有相关机构在做这方面的探索,比如,根据读者的阅读时间向其推荐散文集中被频繁阅读的若干篇文章[3]。
与阅读时信息加工相关的研究主要包括阅读训练法和阅读心理学研究。在众多讲解阅读训练法的图书中,最经典的图书是莫提默·J.艾德勒和查尔斯·范多伦的《如何阅读一本书》,该书系统地分析了阅读活动。还有图书针对某一类型图书的阅读方法进行介绍,例如,托马斯·福斯特的《如何阅读一本小说》。还有一类图书专门讲解如何提高阅读效率,例如,彼得·孔普的《如何高效阅读》。阅读心理学对读者从书面语言中提取视觉信息以获得意义的过程进行研究。白学军、闫国利等著的《阅读心理学》一书对阅读心理学进行了很好的综述[4]。该书对眼动与阅读、字词识别、词切分机制、句子理解和语篇理解等方面的研究进展进行了总结。
与阅读后知识利用相关的工具包括做读书笔记的图书和笔记APP。奥野宣之所著的《如何有效阅读一本书:超实用笔记读书法》一书详细介绍了如何使用笔记来辅助读书,并推荐了若干款辅助写读书笔记的实用文具[5]。以“当当读书”为代表的数字阅读APP提供了管理读书笔记的功能,在很大程度上方便了读者。对纸质书读者,近几年出现的“豆瓣笔记”“百度涂书笔记”和“萝卜书摘”等纸质书电子笔记APP提供了辅助做笔记的功能。这类APP能够帮助读者比较方便地做笔记,并且可以基于读书笔记使读者结成读者社群。“百度涂書笔记”APP还提供了在网页上将笔记生成PDF文件的功能,但笔记本身的价值还有待进一步挖掘。
二、人工智能提升图书阅读效率策略分析
目前,针对图书阅读三个阶段效率提高方面的工作都在陆续开展,业界都有相关的产品跟进,人工智能的发展为这些工作的整合提供了机遇。
1.人工智能提升图书阅读效率的总体思路
现有的推荐技术是依据读者在浏览、购买和阅读过程中产生的大数据而工作的,这虽然是一种高效的推荐方法,但也带来了问题。首先,这会造成大数据歧视,对出版社而言,大数据推荐结果会偏向那些已经热卖的图书,因为这些图书有大量数据可供分析,这种推荐方法对新书和小众图书则非常不利。其次,这种推荐方法容易造成信息茧房,对读者而言,推荐的内容和已读内容有较高的关联性,会使读者的知识面受限制。笔者认为,我们可以用基于知识图谱的内容推荐方法来解决上述问题。这种推荐方法在使用人工智能向读者推荐阅读材料时,会考虑材料所包含的知识和读者已有知识在知识图谱中的延展性,既能使新书和小众图书更快进入读者的视野,又能拓宽读者的知识面。
根据阅读心理学中语篇理解的图式理论,阅读中,读者试图从记忆中寻找能够说明文本内容的图式,理解就发生在相关图式被找到或被具体化时,图式能够对文本内容提供预期,这种预期能够加快阅读[4]。根据认知心理学,读者在阅读时需要把相关记忆从长期记忆提取到工作记忆中,而这个过程需要一定的时间[6]。根据上述理论,读者在阅读的过程中需要一定的时间从长期记忆中提取已获得的图式。如果读者阅读与自身所处情境有关的材料,相关图式很可能已经被提取到工作记忆中,从而能增进读者的理解并加快阅读速度。
根据上述分析,本文提出的人工智能提升图书阅读效率的总体思路是根据知识图谱、情境和读者大数据向读者推荐阅读材料;在阅读前提示读者复习相关笔记,以期将相关图式从长期记忆提取到工作记忆中;在阅读时辅助读者做读书笔记;在阅读后对读书笔记进行分析,形成读者的阅读地图,方便下一轮的阅读材料推荐和阅读理解。
2.阅读前材料选择
现有的基于读者大数据的图书推荐功能已经比较发达,本文认为应在此基础上发展更细粒度、基于情境和知识图谱的推荐方式。有研究表明,读者在阅读时注意力可以持续20分钟[7]。中文的正常阅读速度为309字/分钟[8],也就是读者在一个注意力持续区间阅读6180字,大概十页左右。笔者认为以这样的粒度来推荐内容较好,但显然大多数图书都无法正好被划分成若干这样的部分。图书内容的划分还是应该以内容本身为主,相关机构可以采用人工智能中的语义理解技术对较长内容进行一定的压缩。有研究根据读者的阅读时间,基于笔记数据动态生成图书的精缩本。例如,在读者想要阅读《看见》一书,但只有大约20分钟阅读时间的情况下,相关功能可以仅向读者推荐该书的第一章,该章长度仅占全书的4.94% [3]。
阅读最基本的情境包括时间情境和空间情境。在时空情境中,一些图式已经被读者提取到工作记忆中,此时,将相关阅读材料推荐给读者可以提高读者的阅读效率。初云和闫举纲以华章书院为例分析了出版社自建社群的场景化要素,并梳理了华章书院的场景化社群营销策略,华章书院的场景化要素包括空间环境、社交氛围等[9]。
基于知识图谱进行内容推荐是当前的一个新趋势。人民卫生出版社借助人工智能技术,以该社临床知识库资源为基础建立知识图谱,并根据用户数据构建个性化知识图谱,从而向用户提供知识服务[10]。知识图谱的构建是一个复杂的工程,成本非常高。国家数字复合出版系统工程的结构化加工制作体系中包含了领域本体构建与管理系统,该系统能够为出版社构建知识图谱提供支持[11],该工程已于2017年发布了V1.0成果。中文开放知识图谱联盟OpenKG搭建的OpenKG.CN平台上也有若干开放知识图谱数据可供利用[12]。
在知识图谱上进行遍历有深度优先和广度优先两种不同策略,前者优先访问某一知识结点的细节,待细节全部被访问后再移到下一知识结点;后者优先访问所有的知识结点,待知识结点都被访问后再进入更细的层次对知识结点进行访问。基于读者大数据的阅读材料推荐技术显然属于深度优先遍历,本文建议相关机构可以依据知识图谱进行广度优先推荐阅读材料,以此来克服信息茧房问题。
3.阅读时信息加工
人工智能提升图书阅读效率在阅读时信息加工阶段可从读书笔记复习、语音朗读和无间断笔记三个方面进行。
如果能够把阅读材料有关的读书笔记展示给读者,使读者对此进行复习,那么,读者在阅读新材料时就能提高效率。读书笔记复习能够很快将相关知识从读者的长期记忆提取到工作记忆中,并能够帮助读者建立新材料和已读材料之间的关联。奥野宣之指出读者在初读一本书时,最好不要空手上战场,可以拿出之前阅读该作者其他书所记的笔记读一遍,从而回忆起当时读书的场景和问题,使阅读更有针对性[5]。数字阅读APP可以集成此项功能,为读者提供增值服务。
阅读时,读者需要将视觉中的文字加工成自己能够理解的信息,如果相关机构能将文本转化为语音,则可以减轻读者阅读时的眼部压力,并且相当于增加了一种新的意义渠道,能够为读者提供更多的信息,从而加深读者对文本的理解。近年来,有声书发展迅速,已经形成了不小的市场,并引起了激烈的竞争。图书的文本形式和音频形式之间显然可以有混合形式,这方面已有实践案例。掌阅APP和京东阅读APP提供了语音朗读功能,可以朗读读者指定页面的文本。该功能以百度语音为技术支持,提供多种不同的声音类型。目前,已有个性化语音合成产品问世,例如,科大讯飞为高德地图定制了林志玲、郭德纲的语音导航。笔者相信个性化语音合成也将助力文本朗读,从而提高阅读效率。
阅读前材料推荐和阅读时笔记复习所依据的重要材料都是读者的读书笔记,因此,在读者的阅读过程中,及时记录笔记非常重要。而不论是读者在数字阅读APP中做笔记,还是在阅读纸质书时做笔记,都会干扰到阅读过程。“百度涂书笔记”APP和“萝卜书摘”APP都提供了对书页拍照,然后通过光学字符识别来获取内容摘录的功能,但该功能操作比较烦琐,容易打斷读者的阅读进程。本文认为相关机构可以利用人工智能中的语音识别技术来解决这个问题。在阅读中,读者通过讲话来标记图书中的重点段落,并记录自己的感想,通过语音识别实时将语音转换成文字,从而生成读书笔记。语音识别技术是一项非常成熟的技术,目前,准确率可以达到97%,市场上已有若干实用产品。例如,中国移动与科大讯飞联合推出的灵犀语音助手已有超过3000万的用户,其中的速记功能可以在线将语音转成文字[13]。
4.阅读后知识利用
在阅读过程中,读者会产生读书笔记和阅读行为数据,这有助于读者复习已读知识并进行创作。读书笔记中蕴含了丰富的信息,相关机构可以利用知识图谱构建技术从读书笔记中生成读者的阅读地图,有助于对读者在知识图谱上进行定位,从而进行广度优先推荐;也可以将读者阅读地图进行可视化展示给读者,使读者对自己的知识结构和局限有一定的了解,从而尽量避免信息茧房问题。
为了防止遗忘已读知识和笔记变成没有价值的笔记,读者可以定期重读笔记。奥野宣之建议读者可以在一个固定的时空情境下重读笔记,如睡前、出差途中,重读频率可以是一周一次或三天一次[5]。本文认为读者可以使用分类技术,根据情境来重读相关笔记,这样能够提高重读的效率。通过重读,书本中的知识能够被读者最大限度地吸收。
多条相关笔记可以被组织到一起形成读者的读书简报,方便读者进行归类复习。百度涂书笔记网站能够将读者的读书笔记生成PDF文件,方便打印,但是对读书笔记的价值还缺乏进一步的挖掘。读书笔记数据包含了原文引用、自己的感想等信息,利用现有的自然语言处理技术可以将这些信息生成符合读者需要的读书简报,如专业知识简报、生活知识简报。
三、关于人工智能提升图书阅读效率的思考
人工智能有望提高读者的图书阅读效率,提高我国的国民阅读数量,对出版业产生一定的影响,并最终可能形成一种新的阅读形态。保罗·莱文森提出了媒介发展的人性化趋势,即媒介正在朝越来越多地再现人性化传播环境的方向发展[14]。上述人工智能提升图书阅读效率的措施中大量使用了语音技术,使读者在大多数情况下摆脱了文本输入,在一定程度上再现了口语时代的环境。
人工智能輔助图书阅读为出版社带来了机遇和挑战。一方面,出版社可以依据自身所掌握的内容资源,构建知识图谱,从而进行知识服务;另一方面,出版社亟需大量人工智能专业人才,有巨大的转型压力。
人工智能辅助图书阅读为出版社整合自身的内容资源并提供知识服务提供了一种方向,也为互联网企业争夺注意力入口提供了一种可能性。人工智能能够在多大程度上提高图书阅读效率,继而提高我国国民的阅读量,无疑最终还取决于学界的研究和业界的实践。
|参考文献|
[1]央广网. 第十四次国民阅读调查报告发布数字化阅读率提升显著[N/OL]. (2017-04-19)[2017-11-26]. http://china. cnr. cn/gdgg/20170419/t20170419_523714122. shtml.
[2]中国网. 国务院法制办审议通过《全民阅读促进条例(草案)》[N/OL]. (2017-06-05) [2017-11-26]. http://news. china. com. cn/txt/2017-06/05/content_40964731. htm.
[3]严志永. 基于读者笔记数据动态生成图书精缩本研究[J] . 出版广角,2016(24):15-17.
[4]白学军,闫国利等. 阅读心理学[M]. 上海:华东师范大学出版社,2017.
[5][日]奥野宣之. 如何有效阅读一本书:超实用笔记读书法[M] . 张晶晶,译. 南昌:江西人民出版社,2016.
[6][美]凯瑟琳·加洛蒂. 认知心理学:认知科学与你的生活(第5版)[M]. 吴国宏,等,译. 北京:机械工业出版社,2015.
[7][美]艾比·马克斯·比尔,美国普林斯顿语言研究中心. 如何阅读:一个已被证实的低投入高回报的学习方法[M]. 刘白玉,韩小宁,孙明玉,译. 北京:中国青年出版社,2017.
[8]廖建桥,张万山. 论中文的阅读速度[J]. 人类工效学,1996(1): 38-41.
[9]初云,闫举纲. 激活场景 引爆社群——从华章书院看出版社自建社群营销模式[J] . 出版广角,2017(15):30-33.
[10] 董良广. 出版企业基于人工智能开展知识服务的路径探索——以人民卫生出版社为例[J]. 出版广角,2017(14): 16-19.
[11]刘成勇. 融合发展 恰逢其势——实施创新驱动 推动转型升级 实现融合发展——国家数字复合出版系统工程总体架构[J]. 科技与出版,2014(11):3-7.
[12]漆桂林,高桓,吴天星. 知识图谱研究进展[J]. 情报工程,2017 (1):4-25.
[13]尹丽波. 人工智能发展报告(2016-2017)[M]. 北京:社会科学文献出版社,2017.
[14][美]保罗·莱文森. 人类历程回放:媒介进化论[M]. 邬建中,译. 重庆:西南师范大学出版社,2017.
相关文章!
  • 新常态背景下供给结构转型的逻

    【摘要】吴敬琏等学者编著的《供给侧改革》一书,选题切合时代需求,研究视野宏阔,求真务实且见解独到,弘扬了改革创新的时代精神,具有强烈

  • 电视剧《西藏秘密》的史诗性

    王泉<br />
    根据刘德濒同名小说改编的46集电视连续剧《西藏秘密》,以僧人扎西顿珠的沧桑人生经历为线索,真实再现了20世纪30至50年代末

  • 个性打造精品特色塑造名牌

    陈 雪<br />
    【摘要】时下,收看电视新闻评论节目,成为观众更深层次了解新闻的热门途径。迄今,CCTV4套《海峡两岸》已成为一档优秀的电视新