基于VCA模型的出版企业数据治理研究
刘一鸣 谢泽杭
【摘要】 ?大数据时代,充分实现数据价值成为出版企业可持续发展的重要内容,数据治理成为出版企业创造数据价值的重要手段。出版企业数据治理可分为基础性活动——数据驱动模式和支持性活动——数据治理保障。数据驱动模式涵盖数据采集、数据开发与数据利用三大根本环节,数据治理保障包含质量保障、安全保障和权属保障。两者共同推动出版企业数据价值的实现。基于此,文章从基础性活动和支持性活动出发,探索出版企业数据治理的实践路径,以期为出版企业数据治理提供现实参考。
【关 ?键 ?词】价值链模型;出版企业;数据治理
【作者单位】刘一鸣,湘潭大学公共管理学院;谢泽杭,华东师范大学政治学系。
【基金项目】国家社科基金项目“基于绩效评价的数字出版盈利模式研究”(15CXW008)
【中图分类号】G231 【文献标识码】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2020.10.002
大数据时代,数据资产在各类组织运营中发挥着越来越重要的作用。当下,充分实现数据价值成为出版企业可持续发展的重要内容。数据治理是对数据资产行使权利和控制的活动[1],有效的数据治理有利于出版企业数据的集成与深度利用,从而实现数据资产价值最大化,助推出版企业进一步发展。目前,学界关于数据治理的研究主要集中在政府公共管理和公共服务领域,对拥有众多数据资源的出版企业关照较少,导致目前出版企业对数据治理实践路径缺乏具体认知的问题难以得到有效解决。在此背景下,文章基于价值链分析模型,结合出版企业数据治理的现实需求,构建出版企业數据治理VCA模型,从基础性活动——数据驱动模式和支持性活动——数据治理保障两个维度厘清出版企业数据治理的具体内涵,探索出版企业数据治理的实践路径,以期为出版企业数据治理提供借鉴。
一、VCA模型与出版企业数据治理
文章将价值链分析模型作为理论基础,根据出版企业数据治理的现实需求,构建出版企业数据治理VCA模型,并以此作为研究框架。
1.理论基础:价值链分析模型
价值链分析(VCA,value chain analysis)模型是由美国哈佛商学院著名战略学家迈克尔·波特提出的。波特认为企业创造价值的过程可分为基础性活动和支持性活动,基础性活动是创造价值的根本环节,涉及企业的生产、销售和售后服务等基础性环节,而支持性活动则为基础性活动及企业价值的创造提供保障[2]。VCA模型已被广泛运用于各学科领域。Li J等[3]根据VCA模型对沈阳某大型企业进行调研,发现基础性活动和支持性活动对企业产生高利润有重要作用。Xie Z H[4]从政府公共治理的角度入手,构建政务视频号传播价值链模型,并据此从基础性活动和支持性活动两方面提出政务视频号运营的传播策略,以实现政务视频号传播价值。雷宇等[5]基于波特的价值链分析模型和竞争模型,分析报业困境的诱发因素,梳理新环境下报业集团内容生产的主要价值活动和辅助价值活动,指出了价值链重塑对报业核心竞争力构建的现实意义。黄炳超等[6]通过VCA模型分析了应用型高校内涵式发展的内在机理,探究了组织成本和竞争优势,提出优化高校内涵式发展的价值链要素。从中我们可以看出,大到国家层面,小到企业层面,VCA模型无论是对以经济属性为主导的客体研究,还是对公共属性占优势的客体研究,均有其应用价值与可行性。价值的创造是任何组织管理的灵魂,对追求社会效益和经济效益“双效”最大化的出版企业来说,VCA模型与其组织管理具有高度的契合性。
2.现实需求:出版企业数据治理的必要性
随着出版企业数字化转型的不断深入,数据成为出版企业越来越重要的资产,数据治理反映了出版企业的现实需求。有效的数据治理对内而言,使信息通过重组整合成为具有价值的数据资产,通过构建适合的数据治理管理体系,使数据采集、数据开发、数据利用的流程得以顺畅实现,从而提升数据价值,创造利益,同时也大大降低了数字垃圾的治理回收成本。对外而言,出版企业数据治理有利于行业数据统一,促进出版业标准化发展,降低数据共享的难度,并便于出版业通过数据特征发现市场异动,助力监管和决策。此外,标准化的数据还有利于构建出版产业信息安全体系,为出版企业提供数据安全保障。出版产业数据治理所产生的效益可以反哺出版企业,促进出版企业可持续发展。综上所述,有效的数据治理对出版企业自身和出版产业来说是十分必要的。
3.研究框架:出版企业数据治理VCA模型
基于波特的价值链分析模型,结合出版企业数据治理的现实需求,本文构建如图1所示的出版企业数据治理VCA模型。该模型分为基础性活动和支持性活动两部分。基础性活动是出版企业数据治理的根本环节,即出版企业数据驱动模式,由数据采集、数据开发和数据利用三个要素组成,共同作用于数据价值;支持性活动指出版企业数据治理保障,包含质量保障、安全保障与权属保障,助力基础性活动的进行。基础性活动和支持性活动合力推动出版企业数据价值的实现。
二、基于VCA模型的出版企业数据驱动模式
出版企业数据驱动模式是出版企业数据治理的基础性活动,由数据采集、数据开发和数据利用三个部分构成。三者共同驱动出版企业数据运营与管理,对出版企业数据价值的实现起着至关重要的作用。
1.出版企业数据采集
数据采集是出版企业数据治理基础性活动的首要环节。出版企业数据采集的对象主要是出版企业内部的各类数据资产,辅以少部分的外部共享数据资源。根据数据来源与用途的不同,出版企业数据资产可分为资源数据、人员数据、空间数据、设施数据、服务数据和演化数据六大类[7]。这六类数据并没有严格的界限区分,彼此间存在相互融合的情况。出版企业数据采集的功能就在于识别并获取所需的数据。资源数据是出版企业数据采集最为关键的部分,它是指出版企业产品的数字化资源,同时包含出版产品的条目等信息。人员数据涵盖以作者、编辑等为核心的内容生产者的数据资源,以及以读者、用户为核心的内容消费者的数据资源。人员数据的采集有利于出版企业合理调配出版资源,识别受众所需,实现供需平衡。空间数据包含实体空间数据与虚拟空间数据,实体空间数据是出版企业线下的出版物展示窗口、自营书店等实体空间所产生的客流量、购买信息等数据;虚拟空间数据是出版企业利用互联网开通的虚拟服务空间(如自有的读书APP、教育服务平台等)产生的数据。空间数据的采集对出版企业深入了解出版服务情况有着重要作用。设施数据指出版企业的管理与服务设备、设施,以及其他实体资产的数据资源。服务数据是出版企业开展的各类型服务活动所产生的数据,服务活动包括阅读推广活动、新书发布会等。服务数据的采集有助于出版企业了解并优化服务活动。演化数据与上述五类数据有所不同,它强调数据资源的时序演变关系,是对一段时间内各类数据的演变过程和趋势进行分析而产生的数据。演化数据的采集能帮助出版企业了解一定时期内数据资源的变化情况,从而进行有效决策。此外,出版企业通过互联网等数据共享平台获取外部信息,也是数据采集的重要组成部分。
2.出版企业数据开发
数据开发是出版企业数据治理基础性活动的关键。出版企业在数据采集环节获得的原始数据往往是数量庞大、种类繁多、杂乱无章的“数据杂草”[8],需要对所采集的数据进行加工和处理。数据开发要经过数据筛选、数据分析加工和数据可视化三个步骤。数据筛选能够发现出版企业在数据采集环节所收集数据的错误,检查数据的一致性,及时进行纠正,有效处理无效值和缺失值,使真正需要的数据进入下一个数据开发步骤。数据分析加工可以有效实现出版企业数据资源的分级分类,将无序的数据进行分类整合,生成有价值和有意义的数据资源。数据可视化将经过抽取整合出来的数据资源,通过图表、动画等呈现方式,对数据加以可视化解释[9],使得数据使用者能够快速准确地读取数据。
3.出版企业数据利用
数据利用是出版企业数据治理基础性活动的落脚点,也是数据价值实现的直接渠道。数据利用指在数据采集和数据开发后进行的数据服务、数据共享和数据交易。数据服务可以为出版企业的读者、用户提供数据使用渠道,使数据成为提高出版企业服务能力的重要手段。数据共享能够促进数据流动,打破数据垄断,实现出版产业数据价值的最大化。数据交易则将数据本身作为产品进行流通,实现数据资源使用方数据原料的获取和数据资源提供方经济效益的生成,使数据交易双方达到互利共赢的目的。经过数据利用环节后,出版企业又会获得新的数据资源,并等待下一轮的数据采集。
三、基于VCA模型的出版企业数据治理保障
在出版企业数据治理VCA模型中,由质量保障、安全保障和权属保障组成的出版企业数据治理保障作为支持性活动,在保证基础性活动平稳高效运行和出版企业数据价值的实现上发挥着重要作用。
1.出版企业数据治理质量保障
出版企业可以通过资金投入、人力资源、技术开发和制度保障等途径,为数据治理提供坚实的质量保障。出版企业数据治理基础性活动的开展离不开资金投入、人力资源、技术开发和制度保障的支持。资金投入能够为出版企业数据治理的人力资源、技术开发提供财力保证,使得出版企业基础性活动的数据采集、数据开发和数据利用顺利实现。数据价值的实现需要多源数据的融合,然而数据来源广泛且生命周期涉及多方参与主体,即使数据资产来源于出版企业内部,数据依然会涉及是否真实、是否被篡改、多源数据标准和类型是否一致的问题[10]。这就需要专业化人才进行数据资源的开发、配置和管理,高素质的数据治理人才能够为出版企业数据治理提供质量保障。出版企业数据治理的全流程离不开專业技术的支持,出版企业传统的数据治理方式已经难以适应拥有海量信息的数据资源。出版企业要不断开发数据治理的先进信息技术手段,如网络爬虫技术、数据挖掘技术等,保证数据治理的质量。与此同时,出版企业数据治理需要一定的制度体系作为支撑,完善的数据管理运行制度和机制能够为出版企业数据治理的规范有序运行提供帮助。
2.出版企业数据治理的安全保障
出版企业数据治理的安全保障重点关注个人数据保障和企业数据保障两个维度。数据安全是数据治理有效开展的重要保障。传统的物理区隔方式难以保证数据安全,信息窃听、电磁泄漏等对数据安全提出了挑战。数据在传输、使用等过程中,很容易出现安全隐患,其中,最为重要的就是数据隐私安全问题。数据隐私对个人数据而言,是指数据同源的隐私,即用户的个人思想、认知、感知和状态的隐私[7],对出版企业数据而言,则是指基于数据价值的隐私,将隐私视为商品或权利。对此,出版企业数据治理的安全保障能够在一定程度上保护个人数据隐私安全,抵御对出版企业数据防火墙的攻击和对出版企业数据资产的窃取。
3.出版企业数据治理权属保障
出版企业数据治理重视数字出版产业链中著作权人、内容提供商、内容服务商、技术提供商、终端设备提供商、网络运营商、分销和零售渠道及读者等各方的数据权利,尤其是直接涉及出版企业数据资产生成和使用的著作权人、内容提供商和读者的数据权利。著作权人对其作品所产生的资源数据享有著作权,以及在传播作品过程中产生的邻接权;出版企业作为重要的内容提供商,在数据治理中,对开展经营和服务活动所产生的数据拥有数据经营权和数据资产权;而对读者、用户产生的可被出版企业获取并形成数据资产的个人信息,读者拥有包含数据知情权、数据保密权和数据修正权的数据人身权,以及对其拥有的个人数据进行占有、使用、受益和处分的数据财产权[11]。出版企业数据治理权属保障能够使得在数据治理的全流程中,数据权属清晰,各方权利得到应有的认可和保护,既保护了著作权人、读者的权利,也能让读者准确了解出版企业所提供的数据产品的适用范围和方向,在数字出版产业链的各个环节形成权属明确的交易和服务协议,从而推进广泛的合作。
四、基于VCA的出版企业数据治理实践路径
基于对出版企业数据治理VCA模型的深入分析,文章从实践维度探索出版企业数据治理在基础性活动和支持性活动中的具体做法。
1.基础性活动
(1)善用外力,提高出版企业数据采集质量
出版企业在数据采集过程中,面对内外部数量庞大、种类丰富的数据资源,仅靠人工收集无法满足现实需求,应善用技术的外力。大数据时代,诸多新的数据采集工具开始出现,如Hadoop的Chukwa,Cloudera的Flume,Facebook的Scribe等。这些工具均采用分布式架构,通过系统日志采集方法能满足每秒数百MB的日志数据采集和传输需求,帮助出版企业采集内部数据。网络爬虫技术和数据挖掘技术则可以为出版企业获取互联网公开信息提供帮助;对安全性、保密性较高的数据资产而言,出版企业可以通过与企业或研究机构合作,使用特定系统接口等相关方式采集数据。借助技术的力量,出版企业可以克服传统人工收集数据方式带来的数据冗余、数据错误和数据失效等问题,提高出版企业采集的数据质量。
(2)苦练内功,强化出版企业数据开发能力
出版企业要在数据筛选、数据分析加工和数据可视化上下功夫。首先,出版企业通过数据筛选重新审查和校验在数据采集过程中所获取的数据,删除重复信息,纠正存在的错误。其次,出版企业要注重数据分析加工的科学性,优化数据信息的分类管理,实现出版企业海量数据信息的高速检索、查询。最后,出版企业要借助图形化手段,清晰有效地进行数据的传达与沟通,从而实现对数据的深入洞察,为后期数据产品的高效利用创造条件。
(3)内外兼修,实现出版企业数据利用的最优化
对内而言,出版企业可以利用经过采集和开发后形成的数据产品为已有用户服务,为其提供更优质多元的服务内容,增强出版企业用户的黏性。对外而言,出版企业一方面可以借助具备强大存储能力、超强计算能力的统一云平台和大数据平台,推进出版企业可共享数据的有机整合,进行统一管理、认证与交换,促进出版产业数据共享[12];另一方面,可以与数据交易平台开展合作,确定分成模式,推动数据交易的开展,促进出版企业经济效益的实现。
2.支持性活动
(1)多点联动,做好出版企业数据治理质量保障
出版企业要在资金投入、人力资源、技术开发和制度保障上多点联动,做好出版企业数据治理的质量保障。数据治理的开展和平稳运行离不开资金的支持。出版企业应设立专门的数据治理资金,为数据治理的基础设施建设、人才引进、技术支持打好基础。出版企业要加强数据治理人才队伍建设,一是引进相关领域专业人才,二是盘活现有人力资源,通过组织培训等方式提升数据治理的专业能力。在技术开发上,数据资产丰富且实力雄厚的出版企业可以进行人工智能、云计算和区块链技术的应用研发。大多数的出版企业则可选择与相关企业开展合作,为出版企业数据治理提供技术支持。出版企业还要根据自身实际情况,形成一定的数据治理制度体系,使其作为数据治理的行为准则,从而使数据治理有序规范。
(2)筑牢防线,完善出版企业数据治理安全保障
出版企业应与网络安全企业形成合作关系,为数据资产构筑坚实的防火墙。首先,出版企业要对数据划分安全等级,对不同安全级别的数据设置一定的使用权限。其次,出版企业要构建认证与授权机制、数据加密机制等,保障数据安全。最后,陈火全[13]提出基于信誉机制的p2p网络安全策略,指出信誉亦可成为数据治理安全保障的重要参照指标。出版企业可针对用户信誉设置一定的访问权限,确保个人和企业的数据安全。同时,出版企业之间可以打造数据治理产业联盟,共建数据治理安全保障机制,以降低安全保障成本,并形成合力,抵御风险。
(3)借力算法,落实出版企业数据治理权属保障
出版企业在通过协议等方式确定数据权归属、明确责任与义务的同时,还可借力算法,构建出版企业数据治理权属保障体系,特别是对著作权人、内容提供商和读者的权属保障。在著作权人与内容提供商的权属方面,出版企业可以通过算法建立数据利用的管制规制,勾勒出自身合法数据行为的边界,以算法规制实现自身数据赋权,保障著作权人和自身的利益。在用户数据权属方面,出版企业要构建与用户双方共治共享的数据账本,通过加密算法赋予用户“私钥”。对用户拥有数据人身权和数据财产权的个人信息,用户有权进行加密和解密;对用户愿意共享的数据,出版企业也应通过算法与用户进行数据受益分成。出版企业数据治理应借力算法,平衡多方利益,构建和谐的权属关系,落实出版企业数据治理权属保障。
五、结语
在数据资产发挥着重要作用的当下,出版企业只有确保数据的标准化、规范化、可信可用,才能进一步通过数据运营、数据应用实现数据资产管理、发现内部数据问题并发掘数据价值,进而实现数据资产的盘活和有效利用,实现数据价值的最大化。2015年,由国务院印发的《促进大数据发展行动纲要》已施行五年,深化政府和企业数据治理的各项政策机制陆续落地,为促进出版企业数据开放共享,推动资源整合,提升数据治理能力,促进出版产业健康发展提供了更好保障。
|参考文献|
[1]Mike Fleckenstein,Lorraine Fellows. Data Governance[M]. New York : Springer,2018.
[2]Krista M. Donaldson, Kosuke Ishii & Sheri D. Sheppard. Customer Value Chain Analysis[J]. Research in Engineering Design volume,2006(16) :174-183.
[3]Li J,Alan Paisey. Value Chain Analysis Investigation in Shenyang City[J]. Transfer Pricing in China,2019(5) :153-155.
[4]Xie Z H. Research on the Dissemination Strategy of Government Video Acconuts Based on Value Chain Mode[J]. Communication&Education Review,2020(4):113-119 .
[5]雷宇,徐艷梅. 重塑核心——报业集团内容产品价值链再造研究[J]. 哈尔滨工业大学学报(社会科学版),2017(2):133-140.
[6]黄炳超,黄明东. 价值链理论视角下应用型高校内涵式发展的内在机理探析[J]. 现代教育管理,2020(2):71-77.
[7]张兴旺,廖帅,张鲜艳. 图书馆大数据资产的内涵、特征及其合理利用研究[J]. 情报理论与实践,2019(11):15-20.
[8]刘一鸣,谢泽杭. 出版生态视域下我国有声书产业利润杠杆研究[J]. 出版发行研究,2018(2):50-54.
[9]陈硕. 大数据背景下数据新闻可视化传播模式与路径优化[J]. 出版广角,2017(10):62-64.
[10]孟小峰,刘立新. 区块链与数据治理[J]. 中国科学基金,2020(1):12-17.
[11]刘新宇. 大数据时代数据权属分析及其体系构建[J]. 上海大学学报(社会科学版),2019(6):13-25.
[12]郭斌,蔡静雯. 基于价值链的政府数据治理:模型构建与实现路径[J]. 电子政务,2020(2):77-85.
[13]陈火全. 大数据背景下数据治理的网络安全策略[J]. 宏观经济研究,2015(8):76-84.