推进CNONIX国家标准应用 打造企业数据服务平台

    【摘要】CNONIX 标准的建立,旨在为我国出版产业链上的出版商、发行商、数据集成商等各类机构提供标准的图书信息交换格式,实现产业链上图书信息的互联互通,既可通过加速产品信息的流动,促进图书产品的流通效率,又可通过产品信息一次制作、多方应用的方式,降低行业信息的应用成本,提高行业各机构的信息系统应用效率。文章以上海新华传媒为例,探索CNONIX在新闻出版发行行业的应用。

    【关键词】CNONIX国家标准;服务平台;上海新华传媒

    【作者单位】李列群,上海新华传媒连锁有限公司。

    一、CNONIX(中国出版物在线信息交换)介绍

    Online Information Exchange 的缩写ONIX(在线信息交换),是一种以元数据描述图书产品信息的数据交换协议。包括ONIX for Books(图书在线信息交换)、ONIX for serials (连续出版物在线信息交换)、ONIX for Publications Licenses(出版许可在线信息交换)、Licensing Terms & Rights Information(许可条款和版权信息)等多项协议。该协议是1999年由美国出版者协会(AAP)提出并开发的一份产品信息交换协议,旨在让各个出版者能以一致的格式发送丰富的产品元数据给零售商,特别是开展网上零售业务的电商。该协议主要解决图书产品信息的在线交换问题。

    在该协议中,图书是个广义的概念,包括单行本的图书、电子出版物、系列书、套书等。该标准由四个部分组成:ONIX代码表、ONIX概述和数据元素目录、ONIX产品信息记录格式、ONIX XML信息交换规则。它提供了图书产品全面、准确、网络化、数字化、动态描述、维护和交换规范信息,能使图书产品信息和供应信息整合在一个平台,满足书业对信息共享和供应链管理的需求。

    2014年,经中国国家标准化管理委员会颁布的《中国出版物在线信息交换(CNONIX)》国家标准采用了ONIX for Books的元数据描述体系和结构。CNONIX标准基于XML语言进行描述。CNONIX 标准的建立,旨在为我国出版产业链上的出版商、发行商、数据集成商等各类机构提供标准的图书信息交换格式,实现产业链上图书信息的互联互通,既可通过加速产品信息的流动,促进图书产品的流通效率,又可通过产品信息一次制作、多方应用的方式,降低行业信息的应用成本,提高行业各机构的信息系统应用效率。

    2014年,国家新闻出版广电总局同财政部一起将CNONIX国家标准应用示范工作纳入文化产业发展资金的扶持范围,通过项目资金的支持,带动行业各单位积极实施CNONIX国家标准。目前,已有12家示范单位的13个CNONIX应用项目获得财政支持,7家单位的CNONIX项目被纳入国家新闻出版广电总局的改革发展项目库,22家出版单位、发行单位、图书馆、研究机构等成为应用示范单位。

    二、CNONIX在新闻出版发行行业中的应用

    上海新华传媒作为22家示范单位的一员,正努力探索CNONIX在新闻出版发行行业的应用。

    之前,由于图书产品信息的标准不统一,上海新华传媒实施的ERP图书书目信息数据来源分散、格式多样,有来自B2B出版社提供的书目信息,有ERP补录的数据,有馆配的图书征订信息,有大学教材的征订信息,有MARK/CALIS数据等,形成了各种信息相互独立的系统孤岛。在数据规范化上,由于各种原因,ERP的产品重复信息达到了几万条,不完整和不规范的数据充斥在标准的数据中,成为信息系统的负担甚至是垃圾。同时,上海新华传媒的一城书集等线上业务也在逐步发展,需要标准化并符合网上销售特点的产品信息。因此,图书产品信息的标准化和规范化已成为上海新华传媒图书业务整体发展的技术关键。上海新华传媒在CNONIX标准实施中充分考虑CNONIX国家标准的落地,在贯彻CNONIX国标的企业信息系统建设中,计划在以下几方面尝试具体应用。

    1.构建企业的CNONIX云服务平台

    总体建设框图如(图1):

    企业CNONIX云服务平台是企业内的服务平台,行业CNONIX数据服务平台上接原新闻出版总署信息中心的出版发行信息公共服务平台,共享和下载使用行业的CNONIX元数据内容;下接企业和各个业务信息系统,是企业连接和共享行业CNONIX元数据内容的通道和桥梁。同时,平台提供录入、采集、整理、加工基于CNONIX标准图书产品信息的元数据内容工具,为图书出版发行行业建立符合CNONIX标准的图书书目信息服务。

    无论是在户内环境下,还是在“云”里,我们认为,一个应用平台应包含以下三个部分。

    一个基础:几乎所有应用平台都会用到一些在机器上运行的平台软件。它们的各种支撑功能(如标准的库与存储,以及基本操作系统等)均属此部分。

    一组基础设施服务:在现代分布式环境中,应用平台经常要用到由其他计算机提供的基本服务。比如远程存储服务、集成服务及身份管理服务等。

    一套应用服务:随着越来越多的应用平台面向服务化,这些平台提供的功能可为新应用所使用。尽管这些新应用主要是为最终用户提供服务的,但这同时也令它们成为应用平台的一部分。

    云平台是由搭载了云平台服务器端软件的云服务器、搭载了云平台客户端软件的云电脑以及网络组件所构成的,用于提高低配置或老旧计算机的综合性能,使其达到现有流行速度的效果。

    弹性虚拟计算:根据企业不断变化的组织架构、管控模式和业务需求,云平台能为企业云应用服务快速提供动态、灵活、弹性、虚 拟、共享和高效的计算资源服务。

    智能监控运维:云平台能实现对计算资源、存储资源、网络资源、云应用服务7×24小时全时区、多地域、全方位、立体式、智能化的IT运维监控,保障IT系统安全、稳定、可靠运行。

    云服务平台中数据服务包括录入、采集、整理、加工基于CNONIX标准的图书产品信息元数据内容工具。而系统具有以下功能。

    (1)具有CNONIX数据的录入加工功能

    (2)具有CNONIX数据的校对功能和有效性检查功能

    (3)具有数据向CNONIX的转档功能

    (4)具有数据安全性保护和备份功能

    (5)具有多级用户管理功能

    上海新华传媒在CNONIX云平台的建设上,采用了目前先进的高性能和高可用构架的数据分析系统,运用Hadoop分布式数据库、Spark集群计算环境和Nginx轻量级的Web服务器/反向代理服务器。此外,其还使用zabbix实现了对系统和网络的有效监控。

    2.CNONIX标准数据采集、加工、转换、交换、验证的目标

    书目CNONIX标准数据采集系统的建设目标是建立一套架构合理、功能齐全、运行稳定的CNONIX标准数据加工系统。该系统除了应具备ERP原新书目补录功能,还需要与企业内的ERP、WMS、Mark/Calis数据,企业外的图书供应商、图书馆等进行全面的无缝对接,满足实时高效、安全稳定的要求。系统需具备良好的可扩展性,同时能根据公司现有ERP系统的现实情况和对内对外的各种数据源整体制订相应的流程。

    书目数据的CNONIX数据转换设计目标是实现书目数据按照中国出版物在线信息交换图书产品信息格式规范(GB/T 30330-2013)的要求,实现标准CNONIX格式数据的输出。数据交换的要求为建立相应的数据接口,高效安全地和上下游进行CNONIX标准数据的交换。数据验证的要求为采集、加工、转换、交换的数据符合国家CNONIX实验室的验证要求,并通过验证。

    3.探索拓展符合CNONIX标准的“数字出版物业务数据系统”建设

    (1)搭建符合CNONIX标准的数字出版物数据库。上海新华传媒以已有的数字出版物中心书库为基础,结合CNONIX格式文件,增加数字图书新的元数据字段,扩充原有中心书库数据的图书记录信息。主要数字图书相关的扩充信息包括:数字产品技术保护;数字产品使用限制;数字产品使用类型(预览、印制、复制/粘贴、共享、文本朗读、借出);数字产品使用状态;数字产品使用限度(复合元素)(无限许可、有限许可、禁止使用);数字产品数量;数字产品使用单位(份数、字符数、单词数、页数、百分比、设备量、并发用户、不同时间段的内容百分比、天数、次数)等。其他一些非数字图书相关的元数据将同时建立,以便我们未来可以根据数字书号直接查询到对应纸质书籍相关的图书信息。此模块搭建完成后,出版社可直接在平台中按照CNONIX标准填入数字图书相关信息数据。

    (2)调整现有系统及流程,以满足新标准数据的录入和转出。为了满足符合CNONIX数据格式标准的需求,公司原有的转档流程以及相关系统将升级改造。对于一些数字产品需要输入的字段,我们将开发新的输入程式以供转档人员在转档环节增加录入。如未来CNONIX的云服务平台搭建完成后,一些图书的基本信息(如作者、书名、简介等)不再需要通过扫描电子书后获取,而是直接由接口访问CNONIX云服务平台,根据数字图书的唯一编号获取可访问信息后下载使用,如此,不仅减少了扫描过程中数据的错误率,而且极大地提升了转档效率。

    对企业已有的数字图书销售数据以及各阅读器所采集的用户阅读行为数据,我们也将开发新系统,将数据整合后导入本地CNONIX数据库,再由上传接口上传到企业CNONIX云服务平台,达到和纸质书结合分析统计的目的。

    在CNONIX标准下,我们计划搭建企业内的数据服务云平台的数据接口,从而实现数字图书的完整数据统计目标。接口部分将采用Microsoft .NET框架建立跨平台的Web Service服务,将数据格式转成标准的XML格式加密传递。平台接口搭建完成后,只需将标准的格式化数据提供给企业内部的数据服务云平台即可,例如ISBN编号、图书定价等。

    4.CNONIX将应用在图书行业数据分析系统中

    统一、标准的元数据有利于出版发行行业的大数据分析。CNONIX标准的推广应用,给出版发行行业一个良好的契机来推动本行业的大数据发展。上海新华传媒的云服务平台将利用大数据技术定期提供包含出版数据、流通(零售)数据、数字图书馆阅读数据的分析和研究。为出版发行的大数据分析开发出更加智能化的行业大数据平台,实时提供包括购买行为分析平台、阅读行为分析平台、预测模型建立等,成为专业型大数据库。通过大数据分析,我们可以为行业和政府管理部门定期提供以下报告。

    (1)图书市场监测报告

    (2)图书监测销量排行

    (3)书店采购指南

    (4)出版社/集团报告

    (5)区域市场分析报告

    (6)数字图书阅读分析报告

    (7)图书馆读者行为分析报告

    通过以上报告,我们可以对行业进行大数据分析,包括出版的大数据、发行的大数据、零售的大数据等。

    出版的大数据,意味着出版已经不再是靠经验和直觉,而是需要大量的数据支持。图书在出版阶段,包括策划、编辑、营销的各个过程中都需要相关云端数据的支持。企业利用已有的信息平台,已汇集了300万种图书出版数据,和自2004以来的25个省、自治区、直辖市1500多家大中型书店的零售数据,以及数字图书的大量图书馆借阅原始数据。这个云平台可以为出版社提供海量的信息,包括谁在看书、看什么书、年龄构成、特定图书的历史销售、地区销售差别、定价策略等。CNONIX标准的应用,使图书出版数据、流通数据、借阅数据三个云数据库标准统一、信息关联更加方便。图书数据CNONIX标准化将为出版大数据分析提供更加详细的信息,例如参与者信息不仅包含作者信息,还会有前言、插图、封面设计等各类相关内容。出版营销也可以从粗放式转向数字时代的精准营销,做到有的放矢。

    发行的大数据,意味着发行工作已经不能简单地依靠传统经验,而是“谋定而后动”,即分析相关图书的历史销售数据,图书发行的数量、时机都将是科学的决策。交易中心云数据平台提供的实时信息反馈,会及时修正发行策略,提供具体信息,包括及时增印、调整库存、区域调整等,帮助发行真正做到“随机应变”。

    随着图书零售O2O模式的建立、图书阅读O2O模式的建立,交易中心采集的这些数据将更加及时、详细。用户的购书行为,包括什么时间、地点、出于什么目的而购买、同时买了什么、持续的购买行为等将建立更加详细的购买行为数据。用户的阅读行为,包括什么时间,在哪儿,看了哪本书的哪一页,甚至每一页的停留时间等信息,我们都可通过大数据技术精准获取。

    我们的中心核心数据库和分析系统的CNONIX也将扩容系统,为出版发行的大数据分析开发出更加智能化的行业大数据平台,包括购买行为分析平台、阅读行为分析平台、预测模型建立等。通过系统集成,我们集合服务器、网络、存储硬件,使用商用数据库软件、系统中间件和自主开发的行业数据管理软件,为行业提供高效有用的信息。

    上海新华传媒的CNONIX国家标准实施的整体目标是建成新华传媒CNONIX云服务平台数据中心和沪版图书CNONIX标准书目的加工服务平台。此外,我们还希望公司的图书产品及相关信息的数据中心及服务平台,通过数据清洗等技术手段,成为上海地区的CNONIX数据应用中心。

相关文章!
  • 网络时代的广播节目创新

    周彤<br />
    直播网事,<br />
    变看的网络为听的广播<br />
    2011年1月,南通电台全新打造了一档早间新闻节目《直播网事》,面向早晨赶着上

  • 关于新闻史学习的几点思考

    李岩<br />
    【摘 要】李彬所著的《中国新闻社会史》并不是一本传统样式的教科书,而是一部根据其授课内容记录整理的讲稿,架构体系新颖,语

  • 中国图书“走出去”需要更多优秀

    【摘要】近年来,在国家政策的大力扶持和资金支持下,中国图书“走出去”的步伐明显加快。随着版权贸易规模的不断扩大,国内对优秀的版权经理