大数据时代的知识服务创新发展及模式选择
【摘 要】随着社会发展和互联网普及,大数据广泛存在,社会生产、社会管理、社会生活都会涉及大量数据,这不仅增加了社会对知识库和知识服务的需求,还为出版传媒业转型和发展提供了新的机会。大数据时代的知识服务以大规模、碎片化、智能化的知识库为基础,应重视科学研究、工程应用、舆情管理等各领域知识库建设,根据知识服务领域、规模要求、内容来源、加工技术、应用场景、渠道特征等特点,做好知识服务系统平台、知识服务模式及策略的优化和创新。
【关 键 词】大数据;知识服务;出版传媒;舆情知识库;模式创新
【作者单位】陈少华,华中科技大学新闻与信息传播学院。
【基金项目】教育部社会科学基金项目“基于知识管理的网络舆情监测与应用研究”(编号:11YJA860004); 中央高校基本科研专项/华中科技大学自主创新研究项目《基于社会风险控制的网络舆情监测知识库开发及应用研究》(编号:2011WA007);武汉市社会科学基金课题《基于城市社会风险控制的网络舆情监测及知识库研究》(编号:11067)。
知识服务最早是图书情报行业提出并实践的。随着社会的发展以及互联网的普及和广泛应用,大数据广泛存在,社会生产、社会管理、社会生活都会涉及大量数据,需要大量的知识库来支撑。知识服务的内涵、形式、技术和目标已经发生了巨大变化,社会需求也骤然增加,为出版传媒业转型和未来发展提供了新的机会。然而,出版传媒机构要在知识服务领域得到发展和壮大,仍面临诸多挑战。本文重点讨论大数据发展对知识服务需求和生产的影响,大数据时代知识服务的内涵和创新,以及知识生产服务模式与策略的选择优化。
一、大数据发展对知识服务业的影响
随着信息技术的广泛应用,社会机构及公众个人信息生产、存储、传播的能力大大增强,加上不同信息单元多重组合和广泛传播的倍增效应,出现了大数据现象,导致大数据时代的到来。大数据现象是信息生产社会化、信息存储数字化、信息传播网络化的结果。据相关报告,全球不同机构存储的视频数据相当于几千亿部数字电影,学术数据库存储有数以亿篇(本)计的论文和著作,政务数据库存储了数以亿篇计的政务报告和文件,股市数据库每天存储几百亿股成交量的交易信息等。大数据对社会的影响涉及各个领域,对出版传媒业的影响也不例外。
1.大数据时代社会对知识服务的需求更加迫切和广泛
首先,在大数据时代,个人或者组织的大多数业务,都涉及大量甚至巨量的数据,通过人力或现行处理工具,在合理的时间和成本范围内,难以实现对相关数据的有效选取、管理、分析、处理,需要专门的知识库及知识服务系统作为支撑。
其次,人们面对的大数据,其来源很广,真假信息混杂,不经过专门处理难以使用。即便是科学研究部门的研究活动,或者社会舆情管理部门的舆情监测分析,面对包含着大量“杂质”的大数据,也需要经过专门筛选和处理才能使用。
最后,當代社会,生产和管理任务极其复杂。比如,飞机设计与维护、桥梁健康监测等,都是高科技的产物。即使是疾病诊断、舆情监测、行政决策等传统社会也存在的事务,如今的情况也比过去复杂得多,往往需要对几十乃至上百种预案进行比较分析,单靠几本专业书籍或者个人掌握的知识是难以胜任的,也难以达到社会期望的要求,需要海量的案例知识库作为支撑。
2.大数据时代为知识服务提供了规模巨大丰富多样的知识资源“矿”
虽然大数据的价值密度有些稀疏,但依然隐藏着大量有效的知识和重要信息,应该得到价值发现和有效利用。但这些信息淹没在海量数据中,信息挖掘和编辑难度高,关键在于要有合适的方法、技术和机制。比如,学术论文数据库属于高质量的大数据,存储了几百万乃至几千万篇论文和研究报告,蕴含着大量的知识,目前虽然给读者提供了一些文献分析功能,但主要还是文献服务。如果有更好的分析工具,学术论文数据库会被发掘出更高的价值。再如,看起来使用价值小的新闻报道数据库,通过转化和挖掘,也可以得到很多的知识发现和应用。基于新闻大数据,我们可以为一个城市、一个行业或者一个部门画像,为其发展提供咨询服务。
3.大数据时代的知识库建设与知识服务具有巨大的前景和市场
大数据促进了知识库建设和知识服务大发展,催生了一批知识服务机构,出现了一个新的服务行业——知识服务业。我国的知识服务领域主要有科学研究领域、社会生产领域、社会教育领域、社会管理领域、专业咨询领域等。
(1)科学研究领域的知识服务是知识服务最早开发、最基本的领域。专业图书出版社、专业期刊出版机构、专业数字出版机构,既积累了大量的专业图书和文献版权,又有市场拓展的动力,它们借助数字技术,建立了各类规模不同的综合或者专业内容资源库。我国有500多家出版社,每年新出版的专业图书超过2万种,累计可生产有效的知识碎片数量超过10亿次,年知识服务价值可达几百亿元。
(2)社会生产领域的知识服务范围更广,规模更大,如设备制造、医疗服务、设备维护、投资融资、农业生产、企业规划等。一套医疗知识库系统可以为广大的基层医护人员提供知识服务和咨询,提高基层医护人员的诊疗和护理水平,节约患者的看病时间和医治费用。一套汽车故障诊断知识库系统,可以为广大的汽车维修机构提供维修指导和知识服务。
(3)社会教育领域的知识服务主要是面向学校、老师和学生。为教师提供优质多样的教案,辅助教学质量评估,虚拟教学实验,为学生提供成长大数据分析服务等。
(4)社会管理领域的知识服务是一个大市场。在知识库的支持下,政府决策的精准度会大幅提高,舆情监测的反馈速度更加快速。中央和省区市报业集团、网站,积累了大量社会动态信息和案例,又面临传统新闻媒体转型的压力,可以建成社会知识库、舆情知识库、产业发展知识库等,为政府部门和企事业单位提供知识库或者咨询服务。
(5)专业咨询领域的知识服务也是重要的领域。大型互联网企业和专业咨询机构,比如新浪微博、百度、腾讯、阿里巴巴等,即拥有巨大的资源,又拥有巨大的用户群,并且已经开发了很多知识服务产品,将成为未来知识服务的重要力量。
二、大数据时代知识服务的内涵与创新
知识服务一般包括知识生产、知识转换、知识管理、知识供应、效果评估等过程,由于社会经济技术的发展,知识服务的形态、手段、技术、方式等多方面也在不断变化和创新。特别是互联网、大数据、人工智能的广泛应用,使大数据时代的知识服务具有许多独特之处。
1.基于大数据的知识挖掘和服务是一项高科技活动,需要专门的数据挖掘技术才能实现知识的提取和服务
据了解,谷歌公司基于网络搜索服务中5000万条检索记录的疾病预测,需要处理4.5亿个数学模型。从知识服务角度来说,需要建立数以亿计的数学模型,并且能够有效地处理。
2.大数据时代也是社交网络时代,社会知识生产服务方式发生了根本变化,呈现信息和知识生产的大众化、社会化、协同化
只有让大规模社会成员参与知识的生产和提供,才能满足社会对知识的需求。过去是少数人生产知识、传播知识,专门机构把关,现在可以做到大众提供知识,比如百度百科、维基百科、知乎、微信公众号等知识分享平台。因此,大数据时代的知识生产和服务平台,应具有大众性、开放性、智能性,需要建立新的知识生产模式,如众筹方式、众包方式、分享模式等。
3.大数据时代知识服务的对象范围,从过去的社会人扩展到智能机器
人工智能技術已经进入社会生产和社会管理领域,甚至出现了工业机器人、家政机器人、写作机器人。为了使这些机器人适应不同的工作场景和要求,相关企业需要以合适的格式和方式向机器人提供知识。随着智能机械的大量应用,为了适应机器人或者智能机械的数据接受和处理方式,知识表达很多是高度结构化、数据库化,甚至是数学化。过去是人需要增加和更新知识,现在不仅人需要新知识,智能机器也需要新知识。以新闻写作为例,过去是人写新闻,写新闻的人需要掌握新闻、写作等知识,现在智能机器在新闻写作领域应用了,同样也需要这些知识,但人和机器需要的知识形态和表达方式不同。中外文翻译也是如此。过去,出版社提供词典、字典、例句汇编等图书资料,而查阅字典、文本翻译是人去完成的,现在通过知识数据库直接由机器完成翻译,用户得到的不是词典,是完整的翻译服务和翻译结果。
4.大数据时代的知识服务需要加强知识库的建设与创新
只有依托信息技术建立了有效的知识数据库,才能开展好知识服务业务。比如,学术研究领域有科学(知识)数据库;工程领域有工程知识库,如设备故障诊断知识库等;舆情监测等社会管理领域有舆情知识库、行政决策知识库等。
以舆情监测领域为例,舆情知识库包括舆情分类知识库、舆情案例知识库、演化模型知识库、引导策略知识库、情感态度知识库。如表1所示。
表1 舆情知识库
舆情知识库类别 基本知识单元 知识单元属性 用 途
舆情分类知识库 分好类的文本 标题、作者、媒体等 用于对新文本分类
舆情案例知识库 整理好的案例 性质、首发媒体、主体等 用于舆情研判参考
演化模型知识库 规范化的模型 模型名、模型算法等 用于舆情演化预测
引导策略知识库 整理好的策略 策略名、策略内容等 用于引导策略制定
情感态度知识库 整理的情感词 词类、词干、词义等 用于舆论态度分析
上述知识库,既可以通过人工检索查询等方法,为舆情管理人员提供咨询参考和建议,也可以用于支撑舆情监测系统。比如,舆情分类知识库往往存储了几万甚至几十万篇已经分好类的新闻或其他文本样本,如财经类新闻文本、社会类新闻文本,或者正面新闻文本、负面新闻文本。有了文本分类知识库中的典型样本,舆情监测系统就能比较准确地对新采集的舆情信息主题、态度等逐一判别,然后总体统计分析得出总的舆情报告。
5.大数据时代的知识服务需要平台创新,建立集成化的知识服务系统和平台
在互联网普及的今天,知识服务系统具备知识资源采集和加工、知识管理、服务运营、服务对象等功能。一个知识服务系统的总体架构如表2所示。
表2 知识服务系统的总体架构表
知识管理与服务平台
知识服务策略及模型 知识共享与分发 知识重组与创新 知识比较与筛选 知识
评价
模型
与
系统
知识生命周期管理(知识更新维护策略和模型)
领域本体知识库 领域主题词表
知识挖掘与标注
原始信息、数据、资料库(通过知识采集工具获取)
从表2看出,知识管理与服务平台是一个功能复杂、各大子系统协同工作的系统。以知识生命周期管理功能为例,当系统运行一段时间后,有些知识就会老化,有些知识可能长期无人使用,就需要相关企业按照一定的策略和模型对知识库更新与维护。如语义标注是目前知识加工的主要方法之一,因此语义标注也是知识管理与服务平台的重要功能。语义标注主要是建立概念和实例间的联系,标明实例间的关系。实例具有多个属性,需要多次标注,但每次标注都丰富了该实例的属性描述。而知识标注任务重、角度多,不同用户对知识的评价角度和兴趣点不一样,通过一定的激励机制,采取众包方式,相关企业可以动员广大网络用户进行语义标注。
三、基于大数据的知识服务模式选择与优化
知识服务涉及平台建设、内容生产、产品开发、服务提供、分享解决等多个环节,每一个环节都有若干模式可供选择,不同的模式,效果不同,这需要我们综合评估,合理选择和优化设计。
1.知识服务平台的架构与建设模式应适应知识服务领域
知识服务平台是大数据时代知识服务的基础设施,需要进行科学的规划和设计,需要搭建合适的平台架构,选择合理的建设模式,适应知识服务的领域和规模要求。以中国知网的“三新农”知识服务平台为例,该平台包括农业现代化知识仓库与“三农”网络书屋、农业科技网络书屋。其中,“三农”图书库、视频库、期刊库、农业技术知识库、科普挂图库、工具书库等,既适应了农业科研、教育的专业应用要求,又为广大农村用户提供了多元化的知识服务,是一个综合性的农业知识服务平台。而作为科学研究领域的IOPscience(英国皇家物理学会期刊数据库) 知识服务平臺,注重的是学术文献的汇集、加工和服务,提供的基本功能板块——消息板块、文献板块、检索系统板块、链接板块,功能设置相对简明。
2.内容生产模式应包括内容来源、加工技术和加工组织模式等方面
知识内容来源越广泛、类型越多,就越需要分类加工、分类组织。“三新农”知识服务平台存有一万多种农业科技期刊、几百种报纸,以及大量图书、视频等,需要分类组织加工。知识加工技术和手段的选择,取决于知识加工精度和自动化程度。知识加工精度越高、层次越深,知识库规模越大,越需要采用先进的技术工具。知识加工组织模式的选择,取决于知识的专业化程度和用户适用面。高度专业的、准确性和正确性要求非常高的知识,就必须由专业人员加工。复杂度不高的知识,可以采取众筹/众包模式邀请用户参与。
3.知识服务产品的内容和形态应根据用户需求、市场渠道等选择
知识服务产品是在知识内容加工基础上开发的,应根据用户需求、市场渠道、使用载体、商业模式,选择合适的产品内容和形态。比如,有可能是报告、PPT、挂图,也可能是APP或者微信公众号等,还可能是电话/网络问答系统。有些用户需要挂图,有些用户需要问答服务,有些用户是自己的智能机器需要知识……因此,相关企业需要根据不同知识内容、不同用户、不同应用场景,选择不同的知识产品形式和开发模式。
4.知识服务运营推广模式的选择,受渠道条件、产品形态、市场规模、社会信用和用户类型分布等因素的影响较大
在传统渠道条件下,代理体系和直销体系是推广的主要方式,而在社交网络普及的情况下,企业要更加重视网络社群营销和推广。选择什么样的知识服务运营推广模式受用户结构和分布的影响。比如,“三新农”知识服务平台分科研教育服务和普及应用服务两部分。农业现代化知识仓库一般多用于科研教育服务,而“三农”网络书屋、农业科技网络书屋一般多用于向农民科普知识,两者的推广方式有所差别。在运营推广中,互动方式的选择也很重要。“三新农”知识服务平台目前采取的是自上而下的互动模式,还有很大提升空间。
5.知识服务商业模式主要由商业策略和交易模式等方面构成
爱思唯尔、IOPscience、同方知网等数据库出版机构在知识服务的商业模式上取得了一定成功。以IOPscience为例,读者可以免费浏览IOPscience 平台上所有文章的摘要和目录。在读者订阅IOPP期刊或者文章作者选择开放获取模式的情况下,读者能阅读文章的全部内容。IOPP按订阅主体分类,主要分为机构订户、联盟订户、个人订户,这种多层面、多角度的订阅模式满足了不同机构、个人、团体的需求,既保证了出版机构的利润,也为世界范围内的图书馆、科研机构以及科研人员提供了获取前沿知识信息的有效途径。
四、结论
在互联网和大数据时代,知识成为生产力的关键要素。传统的信息服务已经不能满足用户需求,信息技术支撑下的知识服务将在当代信息社会中扮演重要角色。大数据时代对知识服务的需求更加迫切、更加广泛,具有巨大的前景和市场,这不仅为出版传媒业转型和发展提供了新的机遇,也为知识服务提供了丰富多样的知识资源“矿”。互联网促进了社会信息和知识生产的大众化、社会化,只有大规模社会成员参与知识的生产和提供,才能满足社会对知识的需求。
大数据时代也是人工智能技术进入社会生产和社会管理领域的时代,知识服务的对象不仅有社会人,也有智能机器。同时,知识服务是以知识库为基础的,不仅需要重视各领域知识库建设,如科学知识库、工程知识库、舆情监测与社会管理知识库,还需要建立集成化的知识服务系统与平台,做好知识服务模式的选择与优化。而知识服务平台的架构与建设应适应知识服务的领域和规模要求,内容生产模式要注意内容来源、加工技术和加工组织模式等要素的有机结合,知识服务产品开发要根据不同知识内容、不同用户、不同应用场景,选择不同的知识产品形式和运营模式。
|参考文献|
[1]官思发.大数据知识服务关键要素与实现模型研究[J].数字技术,2015(6).
[2]李明理.从知识管理到知识服务学术信息数据库的发展转型[J].情报资料工作,2014(2).
[3]李霞,樊治平,冯博.知识服务的概念、特征与模式[J].情报科学,2007 (10).
[4]唐梅华,陈劲杰等,机械制造业公共服务平台知识管理系统的研究[J].机械管理开发,2008(1).