大数据视阈下档案信息化建设新路向

    于英香

    摘要:《全国档案事业发展“十三五”规划纲要》对档案信息化建设的任务设计突破与超越了以往五年规划的框架,从大数据的视角,以开放、创新的理念勾画出2016-2020年档案信息化建设的前景和发展路径。本文从五个方面解构《全国档案事业发展“十三五”规划纲要》所揭示的档案信息化建设新路向:其一,跨越数字档案馆建设边界,构建智慧档案馆建设蓝图;其二,扩展泛化电子文件管理视阈,关注行业电子文件管理发展;其三,走出电子档案双套双轨制困境,试点单套单轨制;其四,超越小数据管理定势,探索与大数据行动的融合;其五,突破档案信息公开的藩篱,走向档案数据开放。

    关键词:大数据智慧管理单套制档案数据开放

    Abstract: The Thirteenth Five-Year Plan of the national archives development surpasses the previous any five-year plan in terms of archives information construction, outlines the prospect and develop? ment path of 2016-2020 archives information con? struction with the perspective of big data and the concept of open and innovation. This article decon? structs the new path of archive information con? struction from five aspects: firstly, stepping over the border of digital archives construction and sketching a blueprint of wisdom archives construc? tion; Secondly, extending the perspective of gener? alized electronic records and focusing on the busi? ness electronic records management development; Thirdly, getting out of trouble of the Two-Set Man? agement about electronic archives and making ex? periments on the single-set management; fourthly, surpassing the small data management and explor? ing the fusion with big data action ; Fifthly, Break? ing through the barriers of archives information dis? closure and stepping into open archives data.

    Keywords:Big Data; Wisdom Management; Sin? gle-Set Management; Open Archives Data

    一、《全国档案事业发展“十三五”规划纲要》信息化建设之新气象

    我国档案事业发展五年规划从“十五”开始将档案信息化建设作为重要议题,但“十五”“十一五”和“十二五”这三个五年规划在信息化方面的突破不大,基本上围绕着电子文件归档与接收、档案数字化、档案数据库系统以及数字档案馆建设等方面进行目标和任务描述。然而,2016年国家档案局发布的《全国档案事业发展“十三五”规划纲要》(以下简称《纲要》)却让档案界为之振奋,尤其是《纲要》对档案信息化建设的重视程度以及在信息化建设的任务设计方面和以往的五年规划相比有了显著的突破与超越。

    首先,《纲要》增加了“面临形势与挑战”的内容,突出了信息化建设方面的挑战:“电子政务建设极大推进和实现了电子檔案的形成、管理;档案信息化与互联网利用成为发展趋势;云计算、大数据和移动网络技术的发展,给信息安全、隐私保护和数字记忆留存带来挑战。从国内看,‘四个全面战略布局、国家大数据发展战略和‘互联网+行动计划的推进,深刻影响档案工作的理念、技术、方法及模式……”“云计算”“大数据”“互联网+”这些时下最热门的技术名词出现在全国档案事业发展规划的文件中确属首次,彰显了国家层面档案部门对大数据时代新技术的重视。随之,国家档案局在《纲要》第三大部分“主要任务和实现指标”中浓墨重彩地规划了如何加快档案管理信息化进程,大数据、智慧管理、社交媒体、网页资源、单套单轨制等新概念、新技术充溢其中,展现了档案信息化建设开放、创新与包容的新气象,也表明了大数据时代新技术、新理念与档案信息化建设将深度融合。本文将《纲要》与以往档案事业发展规划中档案信息化建设内容进行比较,从五个方面解构大数据视阈下档案信息化建设的新路向。

    二、突破与超越——大数据视阈下档案信息化建设新路向

    (一)跨越数字档案馆建设边界,构建智慧档案馆建设蓝图

    2006年,国家档案局在《档案事业发展“十一五”规划》(以下简称“十一五”规划)中首次提及“数字档案馆”,并在总体目标中提出“建立一批电子文件中心和数字档案馆”,在档案法制建设中提出“制定《数字档案馆建设规范》”,在档案信息化建设中提出“进一步推进电子文件中心和数字档案馆建设”。不难看出,“十一五”规划将数字档案馆建设作为档案信息化建设的重点内容推出。随着数字档案馆理论研究的深入和实践试点的展开,2011年《全国档案事业发展“十二五”规划》(以下简称“十二五”规划)对数字档案馆建设提出进一步的要求,主要目标中提出“加快数字档案馆及电子文件(档案)备份中心建设,完成国家数字档案馆建设总体规划的编制工作”;档案信息化工作任务中提出:“贯彻落实国家有关电子文件管理、数字档案馆建设的文件精神,加强以计算机网络设备和数据库为主要内容的档案信息化基础建设;根据电子文件管理和数字档案馆建设的功能要求,配备和开发档案数据库管理系统、电子文件归档管理系统、电子档案移交管理系统、数字档案信息发布利用系统……各级国家档案馆加快数字档案馆建设步伐,有条件的要完成数字档案馆建设,并提供网络信息服务。”

    从“十一五”规划到“十二五”规划,对数字档案馆建设要求的力度显著加强,“十一五”规划中对数字档案馆建设只是点到为止,而“十二五”规划对数字档案馆的建设提出了详细而具体的要求,在措辞上从“推进数字档案馆建设”转变为“完成数字档案馆建设”。从2006年到2015年的10年间,数字档案馆建设成为我国档案信息化建设的重中之重。《纲要》在第三大部分“主要任务和实现指标”中提出持续推进数字档案馆建设,并给予了量化要求:“全国50%的县建成数字档案馆或启动数字档案馆建设项目;全国省级、地市级和县级国家综合档案馆馆藏永久档案数字化的比例,分别达到30%-60%、40%-75%和25%-50%。”而后,《纲要》紧接着提出了“采用大数据、智慧管理、智能楼宇管理等技术,提高档案馆业务信息化和档案信息资源深度开发与服务水平”。虽然《纲要》没有直接提及智慧档案馆,但大数据、智慧管理和智能楼宇管理等却是大数据和智慧城市视角下智慧档案馆的重要基础和技术支撑。

    智慧档案或智慧档案馆的研究在档案界刚刚起步,却在国家档案局发布的政策性文件中正式提出,这是一个明显的信号,说明我国数字档案馆建设的边界需要延伸和拓展,大数据时代数字档案馆建设要向智慧档案馆建设转变。可以预见,智慧档案馆的研究和实践试点将是未来档案信息化建设的特色内容。国家层面从建设数字档案馆到构建智慧档案馆的理念突破,给那些理念滞后、有技术畏难情绪或者叫嚣技术无用论的机构、单位和个人一声棒喝,同时也是一种警醒。

    (二)扩展泛化电子文件管理视阈,关注行业电子文件管理发展

    电子文件管理无论从学术角度还是从实践角度都是近20年来国际国内档案界的热点。因此,在档案事业发展的“十五”“十一五”和“十二五”规划中,电子文件归档一直都是重点内容。然而,这三个规划均是泛谈电子文件,或者强调公文电子文件和CAD电子文件。如“十五”规划提出“研究制定电子文件归档和电子档案管理的制度与办法,积极推广国家标准《CAD电子文件光盘存储、归档与档案管理要求》,试点接收电子档案进馆”。“十一五”规划提出:“规范电子文件归档、管理与接收工作,建立健全电子档案接收机制和相关规章制度。利用电子政务网络平台进行政府公开信息的网上数据传输、采集和档案发布。”“十二五”规划中将电子文件管理与数字档案馆建设并提,特别提出要“配备和开发档案数据库管理系统、电子文件归档管理系统、电子档案移交管理系统、数字档案信息发布利用系统等”。综观这三个规划,基本上都对电子文件采取了泛化的描述方法。

    反观《纲要》,其在任务中提出“加强对业务系统电子文件归档管理,通过推进电子会计档案管理促进电子政务和电子商务文件归档管理工作;制订和完善信用、交通、医疗等相关领域的电子数据归档和电子档案管理的标准和规范”。《纲要》首次具体提出了电子会计档案、电子商务文件,信用、交通、医疗等领域的电子数据和档案管理,其亲民性和实用性的转向路径让人耳目一新。

    我国电子文件管理研究的20年间,科研成果不可谓不丰硕,但是关于理论与实践脱节的呼声一直不绝于耳。除了科研论文饱受诟病之外,科研项目中具体商务、交通、医疗等领域的电子文件管理研究也不多。但这些业务领域的电子文件管理实践却并没有因此停滞,尽管它们并没有一致使用“电子文件”这个术语。国家层面还出台了针对这些领域的规范标准,如2004年8月发布,2005年4月施行的《中华人民共和国电子签名法》针对(商务)“数据电文”电子签名的法律效力和认证办法作了规定,被认为是中国首部真正电子商务法意义上的立法。该法将数据电文定义为:“本法所称数据电文,是指以电子、光学、磁或者类似手段生成、发送、接收或者储存的信息。”关于数据电文与电子文件的概念辨析,在该法出台后档案学界已有一轮学术上的回应与探讨,本文不再赘述,但也仅限于学术探讨,档案部门并没有积极参与实践,一些学者甚至认为电子商务方面的法规与档案界无关。

    随着大数据时代的到来,数据的行业边界越来越模糊,大数据学家舍恩伯格认为大数据时代涉猎大数据的机构或者个人分为掌控数据者、掌握或提供技术者以及拥有大数据思维者三种类型,其中掌控数据者是大数据价值链的核心部分。[1]那么,档案部门在大数据时代若想进入数据掌控者的行列,就不能墨守成规,应突破原有电子文件管理研究视阈,敏锐地认识到存在于各行各业业务系统中数据的价值,参与对这些数据的采集与管理,实现大数据时代电子文件与档案数据管理的跨越式发展。

    (三)走出电子档案双套双轨制困境,试点单套单轨制

    关于电子档案的保存模式,从2002年起,国家档案局、国务院办公厅等部门就发布了多项法规标准,这些法规和标准一致指向双套制归档和双轨制运行模式,在电子档案管理初期,双套双规制模式成为电子档案管理的法定模式,这也是由当时的理論研究基础和技术条件决定的。然而,随着技术的不断更新,电子文件的类型和运行环境越来越复杂,双套制管理模式的弊端也越来越明显,导致档案理论界对这一制度频频质疑。有学者提出实施双套制是一种“被异化的谨慎”,[2]还有学者认为双套制电子档案管理可能导致“资源浪费、某些文件类型无法双套制、文件流失、凭证性混乱”等问题。[3]理论界和实践部门的专家也普遍认为在社会信息化程度较高的环境中坚持“双套制”,会降低工作效率,违背利用信息化提高工作效率的初衷。[4]

    这些质疑终于在《纲要》中有了回应,《纲要》提出“在有条件的部门开展电子档案单套制(即电子设备生成的档案仅以电子方式保存)、单轨制(即不再生成纸质档案)管理试点”。这种回应还缘于大数据环境下,电子文件归档数量和范围不断扩大,海量的数据信息尤其是非结构化和半结构化数据需要大量的存储空间和管理成本,这些非结构化和半结构化数据又难以纸质或缩微化,双套制实施在大数据时代面临更大困境。因此,单套单轨制既是解决传统双套双轨制问题的出路,也是大数据环境下电子档案管理模式变迁的必然选择。

    当然,我们在诟病双套双轨制困境的同时,不能忽视单套单轨制也存在诸多风险。因此,《纲要》仍然保留“数字档案资源异地异质备份”的提法,这和有条件的部门试点单套单轨制并不矛盾。但是单套单轨制试点工作的开展却留给理论界和实践部门很多思考的课题。比如,满足哪些条件可以试点?哪些类型的电子档案适合进行试点?如何开展试点工作?有无法规标准的保障等等。

    (四)超越小数据管理定势,探索与大数据行动的融合

    小数据有狭义概念与广义概念之分,狭义概念是美国康奈尔大学的Deborah Estrin提出的“在线个体数据”,即以个人为中心的数据;[5]广义概念是我国徐立军为代表提出的与大数据相对的概念,即“在信息和数据不完整的情况下,通过科学抽样和技术调整,为个体或某类具体问题提供数据参考的数据包”。[6]档案界所约定的小数据与大数据是一对互为映射的概念,档案小数据不指向“个人数据”,而是与档案大数据互补,即在大数据概念出现前的非海量、结构化的传统档案数据。

    《纲要》提出“探索电子档案与大数据行动的融合;研究制定重要网页资源的采集和社交媒体文件的归档管理办法”。大数据研究在我国兴起不到5年时间,档案界尚有学者对网页资源、社交媒体文件等和大数据密切相关的新研究领域是否有档案学研究价值,对他们的归档保存是否是档案部门的职责等问题还存在争议。在这种情形下,《纲要》将这些新概念纳入其中,表明了大数据时代国家档案部门将大数据与档案信息化建设深度融合的决心,其意义不言自明:大数据时代,档案数据概念的内涵和外延都发生了变化,既包括传统小数据管理状态下的电子文件与数字档案资源,也包括网络环境下重要的网页资源和社交媒体文件资源。因此,大数据时代,我们的话语体系和研究视野不再局限于文件、档案或者信息等概念,而要超越小数据时代的思维定势,积极探索档案信息化与大数据行动的融合,以满足大数据时代档案大数据与小数据管理协同发展的要求。

    (五)突破档案信息公开藩篱,走向档案数据开放

    在中国知网全库中以篇名为“档案信息公开”或“档案信息开放”检索,可搜出期刊论文84篇,其中最早的一篇是1998年吴海亭发表在《北京档案》的《档案信息公开与商业秘密保护》;在“档案学与档案事业”子库中检索篇名为“信息公开”或“信息开放”的论文有426篇,其中篇名中含有“政府信息开放”或者“政府信息公开”的论文有271篇。检索结果至少可以说明两个问题:第一,信息公开或者信息开放研究是档案学界近20年的一个重要研究领域;第二,政府信息公开和政府信息开放是档案学人在信息公开或信息开放领域的主要研究对象。

    然而,在中国知网全库中以“档案数据开放”或“档案数据公开”为篇名检索论文为0篇,但以“数据开放”“数据公开”或者“开放数据”为篇名检索出280篇(论文发表时间跨度为2001-2016年),而且近5年论文数量呈急速上升的趋势;在中国知网的“档案学与档案事业”子库中以“数据开放”或“数据公开”为篇名检索论文数量为0篇,以“开放数据”为篇名检索出论文只有2篇(2015年和2016年各1篇)。这个检索结果也至少说明了两个现象:一是数据开放的研究在其他学科领域已经进行了十余年,在大数据时代达到了高峰;二是档案学界仍然执念于信息与数据的关系,对于数据的提法不以为意,对于大数据时代从信息开放到数据开放的转型缺乏学术与职业敏感度。

    《纲要》提出“建立开放档案信息资源社会化共享服务平台,制定档案数据开放计划,落实数据开放与维护的责任;优先推动与民生保障服务相关的档案数据开放”。在国内档案界数据公开或数据开放研究几乎处于空白状态的背景下,国家档案局超前于理论界,在《纲要》中提出档案数据开放的研究与实践,这是前所未有的,也是国家档案部门在万众创新的大数据时代背景下思维变革的一种体现。《纲要》对档案数据开放的提出也促使档案人加快适应大数据时代的创新节奏,认识到数据与信息的关系已然发生了变化,在其他行业领域数据开放和开放数据的理论研究与实践探索如火如荼的情势下,档案人应从档案信息公开的藩篱中走出来,积极参入档案数据开放的研究和实践。

    三、结语

    全国档案事业发展五年规划是我国档案事业发展的纲领性文件,对档案事业发展起到方向和引领的作用。《纲要》对于档案信息化建设的设计,突破与超越了前三个五年规划的框架,从大数据的视角,以开放、创新的理念勾画出2016—2020年档案信息化建设的前景和路径。《纲要》将智慧档案馆、行业电子文件数据管理、电子档案单套单轨制、网页资源采集归档、社交媒体文件归档、档案数据开放等最新、最前沿、与国家创新发展密切相关的研究课题作为档案信息化建设的主要任务提出,这是大数据时代档案信息化的機遇,更是挑战。档案人只有更新思维,积极谋划并参与这些前沿课题的研究与实践,才能推动档案信息化的发展,才能跟上国家信息化与社会信息化的发展步伐。

    注释与参考文献:

    [1] [英]维克托·迈尔—舍恩伯格.大数据时代—生活、工作与思维的大变革[M].杭州:浙江人民出版社,2013:160-178.

    [2]苏君华.被异化的谨慎——对“双套制”管理的问题分析及策略[J].档案学通讯,2015(4):100-104.

    [3]陶水龙,田雷.电子档案双套制管理问题研究[J].档案学研究,2014 (4):61-64.

    [4]杨博文.档案信息化“十三五”发展研讨会议综述[J].档案时空,2016(2):27-29.

    [5]孙红蕾,郑建明.小数据思维驱动下的数字文化治理路径探析[J].图书馆学研究,2015(18):39-42.

    [6]徐立军.大数据与小数据融合的价值与路径[J].新闻与写作,2015(11):11-15.

相关文章!
  • 施工企业如何推进人才强企战略

    芮蕾中图分类号:F241 文献标识:A 文章编号:1674-1145(2019)4-174-02摘 要 本文以施工企业如何推进人才强企战略为研究主题,通过四方面

  • 皇帝的中央巡视组:中国反贪史

    王戡“巡视组”是当今热门名词,中央每开展一轮巡视工作,都有一批省部级高官落马。在河南,还出现了当地官员在中央巡视组外“截访”的新闻,

  • 有容茶业——诚招“梦想合伙人”

    中国梦!有容梦!一起编织财富梦想!——茶道有容:品味香茗、共创梦想、同享财富。——商道有变:创新求变、差异细分、博弈进取。一、行业前景随着生