论档案部门参与开放数据建设的问题与途径

    吕颜冰

    摘要:首先论述了开放数据的基本内涵、现实意义与理论意义、开展的制约因素,并以英美两国国家档案馆为例分析了档案部门参与开放数据建设的主要途径,最后认为档案馆作为一种社会信息制度在档案事业新常态时期应切实履行公共信息服务职责、创新公共信息服务形式、提升公共信息服务能力、创建开放数据再利用亮点工程。

    关键词:开放数据;公共档案馆;新常态;数据再利用

    Abstract:The paper discussed definitions,implications and constructions issues of open data,took the national archives of the United Kingdom and America as examples to analyze main approaches for domestic archives to participate in constructions of open data project,argued that archives as an social information system should be responsible for the public information services,develop the ability to innovate public information services approaches, improve the public information service abilities,and ultimately create highlight engineering of open data reuse in The New Normal.

    Keywords:Open data; public archives; the New Normal; data reuse

    2015年政府工作报告中李克强总理首次提出“互联网+”。2015年3月16日国家发改委发布了《关于做好制定“互联网+”行动计划有关工作的通知》,指出要以互联网增强公共服务能力,着力提高互联网应用支撑能力。对于政府而言,实现“互联网+”的社会与经济效益的重点在于公共数据的开放与再利用。政府数据的开放共享有利于商业组织和公民平等高效地利用公共数据,促进社会力量共同参与社会治理。麦肯锡认为,开放数据现象虽然是近年来才产生的,但是,随着众多技术的进步,开放数据将更具有现实意义并越来越盛行,开放数据正在成为“新常态”。[1]

    2015年8月31日,国务院印发的《促进大数据发展行动纲要》(以下简称《纲要》)指出我国在大数据发展和应用方面已具备一定基础,但也存在政府数据开放共享不足等亟待解决的问题。2015年9月23日,浙江政务服务网“数据开放”专题网站(http://data.zjzwfw.gov.cn/)正式上线。这是《纲要》发布之后各省份中第一个推出的政府数据统一开放平台,也是继以上海市(http://www.datashanghai.gov.cn)和北京市(http://www.bjdata.gov.cn/)为代表的又一轮政府数据开放建设浪潮。开放数据作为档案事业发展的新契机,应当作为亮点工程来抓,走出一条有档案部门独特性的开放数据道路。

    比较国内政府开放数据网站可以发现这两次行动中所开放的内容“名不副实”。这集中表现为混淆了数据开放与信息公开之间开放内容的区别,因此网站做出的结果更像是一个信息整合而不是开放数据再利用的平台。开放数据与大数据密切相关,开放数据的再利用离不开大数据分析技术,大数据分析以开放数据为数据基础。从我国开放数据建设现状来看,出现此问题不仅仅是信息与数据概念认知障碍的问题,也反映了开放数据高调提出与低质量建设的矛盾。同时,各省市档案局还未大范围地全面地参与其中,如北京市政务数据网中档案局发布的数据存在数据量较少、格式单一、更新迟滞等问题。在英美两国的开放数据政府工程的开展中,联邦档案部门不仅全面参与政府开放数据并在实施经验与开展成效方面已经远远走在世界前列,值得我们关注与借鉴。

    1 开放数据的兴起及其内涵

    “开放数据”一词最早出现于2007年欧盟的“欧洲激励计划”中。2009年,万维网创始人Tim Berners-Lee在TED大会上呼吁政府、科学家、科研部门在网上公开实时的原始数据以培育创新、增加政务透明、刺激经济增长。此后,各国政府广泛地进行开放数据建设。英美两国因其先发优势和系统全面的开放数据推进策略而成为公认的开放数据先驱者。英国公共部门信息咨询小组(APPSI)对开放数据的定义为任何人都可以自由利用、再利用、再分配的公共信息数据。[2]《英国公共部门信息再利用报告2013》中将开放数据定义为在开放许可之内的公共信息数据,具有可访问性、可获取性、再利用性与机器可读性。[3]美国总统行政管理与预算办公室(OMB)对开放数据定义是一种采用结构化方式帮助最终用户发现与利用的公共可用数据。[4]

    开放数据是指任何人都可以访问、使用和共享的公共数据,具有可获取性、机器可读性、免费、不受限制的特点,是经过开放鉴定并且在政府开放许可范围内的,不受著作权、专利权等的限制,可以面向社会公众开放与自由获取。开放数据的核心内涵在于数据的开放性与再利用,这决定了开放数据具有两个层次:首先是在政府许可范围内进行开放,其次是建立关联数据、增强互操作性。麦肯锡全球研究院认为政府不是开放数据的唯一来源,开放数据的来源还包括公司、个人以及非政府组织。[5]政府作为开放数据的主要来源是开放数据的提供者、驱动者、使用者、监管者和政策制定者。

    2 开放数据建设对档案工作的影响

    2.1 开放数据引领公共信息获取新常态。开放数据虽是新近的现象但仍属于政府信息公开的内容,它所体现的开放文化、参与式治理、新技术运用正在促成公共信息获取新常态。开放数据在促进公民信息获取、唤醒公民的数据权意识、建立政府信任机制、提高政府治理能力方面具有积极意义,在创造就业机会、促进科技创新、刺激经济增长方面具有显著的经济效益。据麦肯锡预测,开放数据的再利用每年将为全球产生3万亿美元的经济价值。[6]开放数据还进一步推动了智慧城市的建设。智慧城市同样强调增进政府透明、科技创新、公众参与,开发者根据公共数据开发出导航系统、天气预测系统及其他APP移动应用为城市居民提供了良好的移动生活体验。

    2.2开放数据为档案事业发展带来了新机遇。在公共信息获取新常态下,公共档案馆不再仅仅是国家记忆的保管场所,在促进公共信息获取、鼓励公民参与公共生活、增进社会包容与塑造身份认同方面具有更重要的角色。开放数据要求政府机构将开放数据作为组织原则,确立开放数据思维,建立开放数据文化。这有利于提升档案机构透明度、增进档案工作的社会融入。一些学者提出我国应借鉴欧洲建立国家或地区的数据存档中心或委托某些部门承担这样的责任,进行数据的整合与服务。[7]公共档案馆具有管理公共数据的功能优势,也具备建成公共数据存档中心的制度优势,未来的智慧档案馆将成为政府公共数据的来源中心、公共信息社会化服务的汇聚中心、公民个人信息的存取中心。

    2.3 开放数据为档案学研究提供了新课题。开放数据要求重视大数据时代公共数据与数字服务的理论研究。2014年12月,国际档案理事会加勒比地区分会第十届大会就以“档案与开放数据”为中心议题,具体讨论了个人数据保护、开放政府、档案工作者在公共信息获取中的角色。开放数据具有原始性、真实性、可靠性,一些学者呼吁将开放数据纳入档案话语中,档案学者应更加关注开放数据的研究。[8]英国开放数据建设中“数据权”与“被遗忘权”的提出也引起了图情档界对公民信息权的关注,美国数字政府战略中提出将所有内容看作数据,将政府数字服务的关注点从管理文件向管理数据转变的观点也值得我们思考。

    3 档案部门参与开放数据建设的制约因素

    3.1 开放数据的价值实现受到制约。开放性是实现数据再利用的前提,再利用性直接影响着数据价值的实现。开放性的问题主要表现为公开的数据质量不高,再利用性的问题表现为数据的互操作性不强,而元数据、数据字典、数据格式则直接影响数据的互操作性。此外,数据的安全与保密、个人隐私与知识产权、用户的信息获取与利用能力等问题也不同程度制约着开放数据价值的实现。

    3.2 开放数据的可信性受到质疑。建构主义理论者认为数据在本质上是建构性的,因而数据并不是中立的也没有客观地反映现实。[9]首先,数据收集过程中反映了社会价值和特权模式。诸如移民群体、土著群体、难民和未登记的工人认为政府会损害他们的利益而拒绝上报个人数据,在数据收集过程中这些群体常常被排斥。其次,数据开放过程中的选择性反映了一定的目的性与价值观。因此保护隐私与数据安全、建立政府的社会信任机制对于推进开放数据建设尤为重要。

    3.3 公民的社会参与度不高。开放数据的再利用需要运用专门系统和大数据技术进行统计分析,商业组织在资金和专业技术方面拥有绝对优势,普通公民则缺乏专业技术与数据理解能力。开放数据仍由国家和商业用户控制,公民的参与度较低并且在社会治理中的话语权较弱。开放数据再利用不仅仅是民主政治和技术问题,还需要从人文社会角度考虑不同用户需求与应用能力的差异。

    4 档案部门参与开放数据建设的途径

    4.1 顶层设计:遵守相关法律与制定战略文件。遵循修订相关法。开放数据首先要遵守《信息自由法》、《数据保护法》、《电子政务法》、《隐私权法》等现存法律文件的相关规定。2009年,英国首相卡梅伦提出“数据权”(right to data)。为了适应“公民数据权”的提出,英国政府还修订了《信息自由法》和《自由保护法案》,赋予任何公民都拥有数据权并且可以要求信息服务机构提供任何格式的公共数据。

    联邦政府文件。2012年5月,奥巴马签署了数字政府战略文件《数字政府:为更好地服务美国人民建立一个21世纪的平台》,确立了以信息为中心、共享平台、以用户为中心、安全与隐私平台四大战略原则为基础的数字服务概念模型。2013年5月,奥巴马签署13642号总统令《促进政府信息的开放与机器可读》,要求所有的联邦政府独立机构必须执行开放数据政策,这是NARA参与开放数据的重要政府文件。2015年10月,美国白宫政府网站公布了《第三次开放政府国家行动计划》,致力于建设一个以公民为中心的政府,其中就包括提高公民获取政府数据以保支持决策所需的知识和工具。

    联邦机构文件。2010年,NARA制定部门的《开放政府规划》,指出要通过执行开放数据政策强化机构透明度。2011年8月,英国内阁办公室发布了《使开放数据成为现实:一种公共咨询》,旨在征求政府各部门意见推进开放数据开展。2012年6月,内阁办公室发布了《政府开放数据白皮书-释放潜力》,提出了增强访问、建立信任、数据利用更加智慧的建设方式与目标。2013年5月,OMB签署了《开放数据政策-作为资产管理信息》,这是NARA执行开放数据政策的主要依据性文件。

    4.2 组织建设:设置专门组织与举行研讨会议。设置专门组织。2010年,英国政府成立了公共部门透明委员会。英国政府还设置了众多开放数据政策执行组织,包括公共数据小组(PDC)、数据战略委员会(DSB)、开放数据研究所(ODI)、开放数据用户小组(ODUG)等。美国联邦政府总务管理署则成立了数字服务创新中心与咨询小组,协助各联邦机构建立共享政府信息、数据与服务平台。2012年,白宫成立了总统创新伙伴(PIF)协助联邦机构实现创新数字服务的目标。

    举行研讨会议。许多开放数据的文件、开放标准与原则都是在专家小组研讨会中逐渐确立的。2011年7月,APPSI召开了开放数据专题研讨会,英国国家档案馆馆长、信息政策与服务部门主任等七人作为国家档案馆的代表参加了此次会议。APPSI公布了《公共部门信息和开放数据的一种国家信息框架》讨论稿、《开放数据和PSI术语表》。

    培育组织文化。英国《开放数据白皮书》指出公民数据权的有效实现不是建立单一的或者固定的立法条款,而是通过众多现有法律的整合来推行措施,特别强调了政府开放文化的建设。

    4.3 标准建立:制定开放原则与开放政府许可。制定开放原则。英国公共部门透明委员会确立了公共数据的14条原则。要求公共数据的发布要及时、持续,公共数据通过开放数据网站可以轻松获取,公共数据的再利用须在开放许可之内,创建数据目录,公布元数据,建立数据词典,公共数据使用开放标准公布同时遵循万维网联盟W3C相关建议等。OMB签署的《开放数据政策-作为资产管理信息》也对开放原则做了类似的规定。

    设置评估标准。英美两国都十分重视开放数据建设的评估,通过门户网站和官方博客等社交媒体收集公众和员工的批评与建议。对于开放数据不同层次的评价标准,英国《内阁办公室开放数据战略》中采用了Tim Berners-Lee的开放数据五级方案。英国政府还建立了一个跨政府的关联数据工作小组,旨在通过与数据拥有者、数据使用者和W3C合作,促进政府间通用URIs标准的设置。

    开放政府许可。许可是指允许使用信息的一种法律文件或者给予正式牌照(通常是书面)授权的行为。[10]开放政府许可是一组通用的条款和条件集合,对于公共部门信息提供者的信息哪些可以利用和再利用做了规定。[11] 2010年9月,英国国家档案馆发布了《英国政府许可框架》(UKGLF),其核心是开放政府许可OGL。在英国已经有214个地方政府采纳了OGL,德国、韩国也将OGL作为模型。

    4.4 平台建设:建立门户网站与创新共享应用。政府门户网站。政府门户网站是开放数据再利用的首要平台。2009年英美两国政府分别建立了开放数据网data.gov.uk和data.gov,目前分别已有数据集24789和131768个,其中国家档案馆的数据集分别有48和69个。英美两国国家档案馆均遵循相关文件要求发布机构数据存储目录并将机构执行开放数据政策的相关信息发布在门户网站,NARA计划在未来使用最新的HTML5/CSS3技术进一步改善门户网站设计和用户体验。

    应用程序接口。Web APIs是基于web的程序与程序间的接口,是实现数据互操作的一种手段。美国数字政府战略要求联邦机构遵循数据开放标准并通过API向终端用户提供具有互操作性的数据集,OMB要求联邦机构将信息通过Web APIs推送给合适的受众。为此NARA推出了一个面向公共应用程序接口的在线目录,这允许元数据具有JSON/XML/CSV多样化格式。

    内容管理系统。为提供更好的用户体验和实施以用户为中心的数字服务战略,OMB要求联邦机构建立面向用户的系统。2010年,NARA开始实施门户网站Archives.gov三期改造项目。2012年,为建设数字服务共享平台美国数字政府战略要求联邦机构建立共享的开放式内容管理系统(CMS)。目前NARA正在进行项目的第三期建设,主要是将原网站内容迁移到一个基于云平台的内容管理系统。

    APP移动应用。APP应用可以帮助用户在任何时间、任何地点、任何方式都能获得数字服务,是利用开放数据的有效途径。美国数字政府战略要求数字服务创新中心与咨询小组协助联邦机构进行跨部门协作启动共享的移动应用发展项目。英国开放数据门户网站允许用户上传APP,网站还公布了由开发者基于开放数据自主开发的372个应用程序APP。

    5 结论

    档案馆应重新审视其在公共信息获取新常态时期的历史使命与战略定位。在参与式社会治理的社会趋势与智慧城市建设背景下,档案部门面对势如破竹的大数据应用与开放数据工程不能无动于衷,而应当对此反应迅速、尽早行动、参与其中。档案馆作为一种社会建制是公民获取政府信息的一种社会制度,因此应当切实履行公共信息服务的职责、与时俱进创新公共信息服务形式、提升公共信息服务能力,通过开放数据再利用创建档案事业新的亮点工程,实现档案的智慧服务与移动服务。

    首先,从现实性来看公共数据的经济属性与参与式社会治理理念更加凸显。开放数据不只是保证公民知情权的工具,更是一种战略资产,强调通过数据的交换、整合与分析实现数据价值链创新。随着国内“互联网+”与参与式政府治理的提出,以云平台为依托的云服务将成为未来公共信息服务建设领域的发展趋势,公共数据也将在更大范围内实现流通与交换。开放数据将对今后档案工作的发展趋势产生深刻的影响。其次,从可能性来看档案部门参与开放数据建设具有制度优势和建设经验。档案事业具有国家最高档案行政管理机构国家档案局,集中式档案管理体制也有利于开放数据自上而下地开展。档案馆也是现行文件阅览中心和政府信息公开查阅场所,对于公共信息公开具有一定经验。最后,从必要性来看档案部门需要增强公共信息服务的核心竞争力。档案馆作为公共服务机构参与开放数据建设是档案部门的应有之义。档案部门虽不能独揽公共信息服务的使命,对于开放数据这一新事物要先知先觉,争当先行者,先行介入才能先行服务。

    开放数据作为档案部门的一项常规性工作而非阶段性任务,其开展需要顶层设计、组织建设、标准建立、平台建设等多种途径配套以相互支持。总的来说,开放数据具有实现数据开放和实现数据可操作性两个步骤/层次。需要注意的是,第一层次中档案部门在有序地进行数据开放时应关注影响开放数据开展的制约因素。档案部门首先应建立社会信任机制以扩大档案部门开放数据的受众范围,其次可针对开放数据的无限制获取和再利用为公民无偿提供所需的知识与工具等条件;第二层次即关联着的档案开放数据,通过建立关联开放数据增进档案数据的再利用。这方面档案学界目前已经形成了一些研究成果,档案部门在运用数据关联技术时应特别注意数据的著录、更新与维护。

    参考文献:

    [1][6]How government can promote open data and help unleash over $3 trillion in economic value[R].NewYork:US.McKinsey Global Institute,2014:23.

    [2]What is the value of open data?[R].London:UK.Advisory Panel on Public Sector Information,2014.

    [3]The United Kingdom report on the re-use of public sector information[R].London:UK.The National Archives,2013.

    [4]OMB.Open Data Policy-Management Information as an Asset[S].2013-05-09.

    [5]Open data: Unlocking innovation and performance with liquid information[R].New York:US.McKinsey Global Institute,2013.

    [7]蒋颖.欧洲社会科学数据的服务与共享[J].国外社会科学,2008(5):84~89.

    [8]Erik Borglund;Tove Engvall.Open data?Data, information, document or record ? [J].Records Management Journal,2014,24(2):163~180.

    [9]Johnson, Jeffrey Alan.From open data to information justice[J].Ethics and Information Technology, 2014,16 ( 4):263.

    [10]Open Data and PSI glossary-Glossary A-Z[EB\OL].[2015-05-25]. http://www.nationalarchives.gov.uk/appsi/appsi-glossary-a-z.htm#O.

    [11]The National Archives.Open government license Guidance for users[S].2014~10.

    (作者单位:上海大学图情档系 来稿日期:2015-10-08)