面向政务信息共享平台的数据文件中心建设构想

    张芳霖 崔皓

    

    摘要:随着计算机、数字化技术在政府公务中的深入渗透,电子文件逐渐成为政务信息主流。但是电子文件生成方便、种类丰富以及传播快捷等特性,在提高政务处理效率的同时,也造成数据壁垒、信息孤岛以及信息增量重复等现象。本文针对这些现象,提出面向政务信息共享平台的数据文件中心建设构想,并从数据文件中心的概念界定入手,从现实需求、顶层设计、技术支撑三个方面分析建设的可行性,并提出具体的业务流程和实现策略。

    关键词:政务共享数据文件中心档案

    Abstract: With the computer and digital technolo? gy penetrating deeply in the government affairs, the electronic records gradually become the mainstream of the government information. Although the elec? tronic records are benefit for improving the efficiency of government with generating conveniently, multiply and spreading quickly, they also bring many prob? lems, like that the data barrier, information island and incremental repetition and so on. This paper puts for? ward the idea of the data records center oriented the government information sharing platform, starts from the definition and analyzes the feasibility of the con? struction from three aspects of the reality demand, top-level design, technical support, and presents the concrete design plan.

    Keywords: Government information sharing; Da? ta; Records center; Archives

    随着计算机、数字化技术在政府公务中的深入渗透,电子文件逐渐成为政务信息主流。一方面,电子文件具有生成方便、种类丰富、传播快捷等特性,能拓展政府办公形式,提高政务处理效率;另一方面,因信息资源部门化,以及网上信息安全因素,出现“数据壁垒”“信息孤岛”以及信息增量重复等现象。为打破“数据壁垒”、消化信息增量,达到信息的真正共享,国内外相关部门及学者一直在研讨。但现有研究缺乏对电子文件中心数据化的总体讨论,特别是针对政务公开背景下的信息资源部门化、利益化以及技术层面的设计研究还显薄弱。本文拟提出面向政务信息共享平台的数据文件中心的构想,并从数据文件中心的概念界定入手,从现实需求、顶层设计、技术支撑三个方面分析建设的可行性,并提出具体的业务流程和实现策略。

    一、数据文件中心的概念界定

    文件中心是20世纪40年代出现的一种新型文件管理机构,起源于美国。英国档案学家艾利斯20世纪50年代首次提出文件运动阶段观点,为文件中心奠定理论依据。文件处于现行文件阶段,为满足机关频繁利用需求,文件适宜保存在机关内部;但随着机关利用频次逐渐减少,文件进入半现行阶段,会寻求中间机构加以保管,文件中心或档案室成为较好的选择;而当文件处于非现行阶段,经鉴定有价值的档案就会移交档案馆保存。但这种文件运动的规律性在信息化时代,借助于计算机以及网络生成和读取电子文件的便利,可实现逆向运行,不同阶段的文件与保管场所之间不再是对应关系,这也使得文件中心与机关及档案馆的联系更为便利。

    本文所述数据文件中心的概念,是基于数据化电子文件而提出的。数据文件中心可以拆分为“数据+文件中心”的概念结构。一方面,属概念仍为文件中心,[1]具备文件中心的档案化管理功能,也就是传统文件生命周期所讲的文件半现行阶段的管理。另一方面,从概念内容来讲,主要针对数据形式的文件,因而融入数据管理的概念和方法,也遵循数据共享的理论逻辑。

    这种数据文件中心不是简单电子文件的集合中心,而是考虑电子文件总体规模,更多针对整体数据考虑多领域、多平台、多主体的电子文件使用和管理需求,从整体上寻求政务信息共享的突破。同时,数据文件中心保有电子文件因果生成关系,呈现电子文件的社会相关需求,从而突破部门政务管理的数据壁垒,克服了传统文件管理注重文件纵向传递的价值周期管理,以及对文件横向的社会联系关注度不够的弊端。

    二、数据文件中心作为政务共享平台的必要性与可行性

    (一)必要性:政务公开对信息共享的现实需求

    政务公开形成机制以来,各级政府部门进行了积极探索。按文件运动周期归纳,主要有门户网站、电子文件中心和综合档案馆三種形式,对提高政府办公水平、增强政务办理透明度均起到积极效用,但若想实现政务信息由公开到共享,其全过程管理就存在流程衔接不畅的困难。门户网站侧重反映机关特色,对共享工作支持力度有限;电子文件中心提供电子文件统一管理,但快速增长的电子文件规模使其疲于规范管理而无暇顾及共享;综合档案馆侧重进馆电子文件长期保存和开发,对未归档电子文件的共享则鞭长莫及。上述现象的产生主要是由于电子文件各阶段管理范围以及利益导向不同造成的,最终导致政府信息资源共享滞后,人民群众正当的档案知情权无法得到保证,因此迫切需要一种全局导向的电子文件管理形式来实现政务信息的共享。数据文件中心从整体考虑电子文件规模、类型和关联,从技术上支持文件运动周期的流程衔接,实现政务信息由公开到共享的升华。

    (二)可行性一:顶层设计的国家意志体现

    法律是国家意志的体现,与相关政策相辅相成。新送审的《中华人民共和国档案法》(修订草案)[2]明确规定,各机关团体组织应当将电子档案管理纳入信息化发展整体规划同步建设,赋予符合规范的电子档案与纸质档案同等法律效力,完善国家和社会治理所需档案信息资源的共建共享。而国务院新出台的《政务信息资源共享管理暂行办法》[3]作为我国第一份关于政务共享的规范性文件,明确了政务信息资源的定义、分类和共享原则,提出建设国家数据共享平台及全国共享体系,对信息共享的范围和责任、权利和义务、管理和协调、评价和监督等做出了硬性规定和要求。从《中华人民共和国档案法》的修改到《政务信息资源共享管理暂行办法》的出台,前者解决电子文件法律效力问题并提出共建共享要求,后者将共享落实到实处并充分发挥电子文件共享优势,两者共同对长期困扰电子文件的法理政策难题做出正面回应,使全过程管理和前端控制进一步制度化、规范化和程序化,推动政务信息化建设进入“集约整合、全面互联、开放共享、协同共治”的新阶段,进而从顶层制度方面呼唤建设新的政务共享平台及体系。

    (三)可行性二:信息技术的有力支撑

    计算机、互联网、数字化等技术日新月异,为数字信息资源进行量化管理提供坚实的技术保障。借助计算机性能不断提升,大量数字信息资源的快速处理、规模存储不再是现代信息管理的噩梦,云计算更是打开一扇通往海量数据管理的门,为不断增长的电子文件提供分布式管理的技术视角。[4]互联网将单独的网络单元进行集约化、规模化管理,配合智能化、窗口化的移动通信设备,促使信息传递和服务进入移动互联时代,使电子文件的生成传播更为方便快捷。计算机、互联网技术的融合开启了大数据管理时代,大规模信息资源的快速量化处理成为现实,并可以经过数字化技术进行可视化展示,为政府、企业和个人的分析决策提供更直观的动态预测。目前我国80%以上信息资源为各级政府部门所掌握,[5]但因缺乏共享导致无法满足社会需求,故需要依托大数据技术进行政务信息资源的整合挖掘。数据文件中心秉持政府需要、行业需要和个体需要相互满足的理念,[6]利用云计算、大数据等先进信息技术支撑国家数据共享交换平台及共享体系建设,消除“数据壁垒”和“信息孤岛”。

    三、数据文件中心的业务流程与建设策略

    依据计算机大数据建设的一般流程以及文件中心的阶段理论,在结合国家政务信息资源目录的基础上,对数据文件中心的业务流程与建设进行如下设计。

    (一)数据文件中心的业务流程

    大数据处理一般包括数据的采集、处理与集成、分析、解释,[7]即对结构数据、半结构数据和非结构数据进行采集,利用元数据等方法进行数据的处理和集成,形成统一标准的数据格式,再用批量处理等数据技术分析和挖掘数据价值,然后通过图表等形式进行结果的解释和呈现。笔者在档案式思维指导下,借鉴大数据处理步骤设计了数据文件中心的业务流程,如图1所示。

    数据文件中心的业务流程包括数据层、平台层、管理层和共享层四个部分。其中,数据层由现有的文件和档案管理体系组成,涵盖各部门档案室、电子文件中心和各级档案馆,包括结构型、半结构型和非结构型电子文件,是建设数据文件中心的现实基础。平台层即政务信息共享支持平台,主要负责共享信息的采集、分类、更新和提供,处理用户的需求与反馈,优化共享界面和体验效果,是连接其他三个层面的桥梁和纽带,也是数据文件中心的建设核心。管理层按照需求与反馈进行共享电子文件的组织开发,对结果进行可视化、故事化和多方交互的编排,形成一系列的政务信息数据库群,并与档案管理部门携手承担共享电子文件的鉴定保存,是数据文件中心的可靠保障。共享层由网站和移动端口组成,主要用来引导用户完成各类共享资源的获取操作,收集用户的使用体验和反馈,是数据文件中心的外围呈现。通过以上四个业务流程,数据文件中心将电子文件的收集、管理和利用置于完整的业务链中,突破了部门权属限制和传统档案管理衔接不畅的难题,从而实现真正意义上的全过程管理。

    (二)数据文件中心的建设策略

    1.数据文件中心共享信息的规范操作

    数据文件中心的建设以政务信息资源为基础,具有敏感性和保密性,必须进行规范的共享操作。第一,对共享信息进行整体分类,编制《政务信息资源目录》。一要坚持法律导向的原则。目前我国信息安全与保护方面的法律法规主要有《档案法》《保守国家秘密法》《科学技术保密条例》等,应当按照现有法律法规制定共享目录,坚持依法共享;二要坚持靈活设置的原则。由于各部门办公环境不同,可以在不违背法律的情况下,适当的突出部门特色。第二,统一共享信息的格式,按照《电子文件归档与管理规范》(GB/T18894-2002)的要求,对共享范围之内的电子文件实行档案化的规范管理,并依据《电子文件存储与交换格式版式文档》(GB/T33190-2016)生成共享电子文件的版式,保证共享电子文件的安全和标准化。第三,共享信息的采集可以借鉴电子文件的归档方式,分为逻辑采集和物理采集,其中逻辑采集有实时在线采集和集中分阶段在线采集,物理采集分为在线移交和脱机移交,具体操作中,应遵从档案部门的指导和实际情况,选择适合的采集方式。

    2.数据文件中心共享技术的合理选择

    数据文件中心的建设以大数据技术为支撑,考虑政务信息的规模、种类和关联,需要慎重的进行技术选择。首先,合理的选用大数据处理模式。目前主流模式有MapReduce、Dryad、Spark等,[8]以MapReduce为例来处理个人信息,首先将含有个人信息的数据进行分割,并赋予每个部分初始键值(key,value)对,这里可以充分利用档案著录基础,将档号作为指定key值,由Map将初始键对进行映射处理,通过Shuffle将Map产生的中间结果内具有相同key值的value值组合,再传递给Ru? duce规约value值,得到包括医疗、户籍、房产等在内的个人信息,进而减少各种“证明”的开具需要。其次,注重共享技术的升级更新。MapReduce作为早期的大数据处理利器,其技术并非一成不变,而是随着数据规模和用户需求的变化不断提升,通用资源框架Yarn就是Ha? doop对MapReduce可扩展性的改进[9]。最后,保障共享技术的延续性。科技进步是时代发展的潮流,共享技术的选用也只能是当前一个时间段内的合理选择,所以一方面要注重选用具有长远价值的技术模式,另一方面也应当注重人才队伍的培养,从而确保数据文件中心的生命力。

    3.数据文件中心共享管理的综合把握

    数据文件中心的建设是一项长期工程,包括技术、资金、人员等众多方面的统筹,需要一套行之有效的管理方法,因此可以借鉴集成产品开发(Integrated Product Development,简称IPD)的管理模式。[10]IPD最先由IBM公司付诸实践,国内华为公司全面学习了IBM公司的经验,通过流程重组、产品重组和市场管理达到了优化企业结构、降低成本、提升创新与竞争能力的目的。IPD涉及跨部门团队、结构化流程、项目管理、异步开发与公共基础模块、客户需求分析、优化投资组合和衡量标准七个部分,相互关联又彼此独立,用户可根据自身需要做出优先选择,分步实施。

    数据文件中心可优先选择结构化流程、项目管理、异步开发与公共基础模块三个方面:结构化流程主要有计划、开发、验证、发布和生命周期,并设置评审点,承担对数据文件中心各建设项目的监督、指导和审议,进而形成统一的开发机制,从程序上对建设进度进行有效管控;项目管理预先设置政务共享的效果目标,选定项目的主要负责者和协同者,通过制定详细的计划对各类资源进行统筹,推动政务共享建设的顺利开展;异步开发是指各层面建设可平行开展,如数据层、平台层、管理层和共享层可在统一规划下同时开展建设,而异步开发的实现需要公共基础模块的支持,公共基础模块包括通用的技术、系统、组件等,对增强共享平台的系统维护能力和缩短建设周期大有裨益。

    4.数据文件中心共享风险的有效控制

    数据文件中心搭建在动态化的信息环境中,网络入侵、木马病毒、信息泄露等多种因素并存,因而政务信息共享的风险真实存在,需采取措施增强抵御风险的能力。首先,安全共享是数据文件中心的基本目标之一,应根据《中华人民共和国网络安全法》《计算机信息系统安全保护条例》等法律法规制定安全共享手册,做到安全保证有法可循,同时严格奖惩办法,对安全事故实行零容忍,进而建立严格的共享安全制度。其次,加强对共享信息的技术控制,一方面通过反病毒、防火墙、数据加密等技术建立起主动防御机制,抵御恶意网络攻击、木马病毒等不确定因素,另一方面通过人脸识别、指纹识别、密码认证等技术建立共享认证机制,防止信息的不正当获取,从技术上保证共享电子文件的真实性。最后,定期开展政府人员的风险防范培训,选取国内外信息安全事故进行典型案例解释,并以动画、快报等形式在移动和网站端口进行公众宣传,提高人们的共享风险防范意识。

    四、结语

    数据文件中心是基于电子文件数据化管理的需要提出的,它作为政务信息共享平台进行建设,既是政务公开对信息共享的现实需求,也是顶层设计的国家意志体现,同时有着强大信息技术的支撑。面向政务信息共享平台的数据文件中心的构想,是档案管理学研究的一个课题,也是政府对现代信息技术理解与把握的一种自信,是法律对公民知情权肯定与接受的一种升华,也是档案界参与政府实现政务信息共享共建的一次难得机遇。但政务电子文件的规范管理和长期保存并没有想象的那么容易,不仅涉及政务数据的敏感性和保密性,还有各种新技术的应用和电子文件管理的成本等问题,未来数据文件中心的研究仍有可探索的空间。

    注释与参考文献:

    [1]肖秋会,刘劲松,汪好.我国电子文件中心研究综述[J].档案学通讯,2011(1):31-34.

    [2]《中华人民共和國档案法》修订草案(送审稿)[J].中国档案,2016(7):17-22.

    [3]国务院印发《政务信息资源共享管理暂行办法》国发[2016]51号[J].中华人民共和国中央人民政府网站(www. gov.vn),2016.9.19.

    [4]刘智慧,张泉灵.大数据技术研究综述[J].浙江大学学报(工学版),2014(6):957-972.

    [5]李克强出席中国大数据产业峰会暨中国电子商务创新发展峰会并致辞[J].网络安全技术与应用,2016(5):115.

    [6]刘晓洋.思维与技术:大数据支持下的政府流程再造[J].新疆师范大学学报(哲学社会科学版),2016(2):118-125.

    [7]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013(1):146-169.

    [8]赵晟,姜进磊.典型大数据计算框架分析[J].中兴通讯技术,2016(2):14-18.

    [9]董西成.Hadoop技术内幕:深入解析YARN架构设计与实现原理[M].北京:机械工业出版社,2014:36.

    [10]梁鸣.集成产品开发(IPD)探讨[J].科技管理研究,

    2010(17):120-122.

    作者单位:南昌大学人文学院

相关文章!
  • 如何加强档案管理

    王美庆中图分类号:F273 文献标识:A 文章编号:1674-1145(2019)5-121-01摘 要 档案是能够记录一个单位发展历程的宝贵历史资料,对今后的

  • 农家人的舍与不舍

    11月15日下午,家住林州市桂园区曲山村的李存伏在林州市红旗渠大道上扫马路。这位已经70岁的老人身板结实,拿着扫把的手挥洒有力。“迟早

  • 想卖货挣钱 要选对产品 用对方

    现如今,产品再好,不搞营销,也难卖货难挣钱!我的健性养生产品(详情上网看)能使人性强体壮年轻长寿!它的效果全面巨大真实可靠,相对还便