基于文件管理的电子邮件分级存储与归档

    卞咸杰

    摘要:基于文件生命周期理论,文章提出了电子邮件分级存储与归档中确保电子邮件的可用性、可控性、机密性、完整性和真实性等目标,并确定了电子邮件分级存储与归档方式,提出合理的分级存储与归档方案。

    关键词:文件生命周期电子邮件分级存储归档

    随着互联网与通讯技术的发展,电子邮件作为政府、企业与外界的主要沟通桥梁,已经成为政府部门之间、企业与客户(供应商)之间保持互动的重要工具。在办公自动化系统中,电子邮件是其最基本的功能。政府、企事业单位通过电子邮件迅速便捷地起草、发送、浏览、分类各类文件、信函等,实现其在政府、企事业单位各部门及个人之间快速的传递。目前,电子邮件的应用已确立一种协同工作的机制,更多的办公自动化系统可以依据不同工作流的处理流程,自动地将文档以电子邮件的方式传递给下一处理对象,通过文档的自动传递,实现复杂的工作流应用。

    1 传统存储与归档的分级方式及其弊端

    传统的存储与归档的分级主要是从数据的访问率的角度来考虑的,根据数据的重要程度、可用性、访问频率和存储成本等技术指标对数据实施差异化管理,把数据存放在相应的存储设备上,一般分为在线存储、近线存储和离线存储三级存储方式。如郑州大学白广思的《信息资源分级存储实现信息生命周期管理》、广东交通职业技术学院周淦淼等人的《分级存储管理在电子邮件系统中的研究与应用》和安徽省经济信息中心缪辉宇的《分级存储技术在数字媒体资源管理中的应用》等都提出了数据三级存储方式的观点。这三级存储的最大优点就是提高整体系统性能,把不经常使用的数据转移到下级存储设备上,需要时刻保持在线的数据就少,这样就减少了系统资源的占用,自然也就提高了整体系统性能。但是,这种传统的存储与归档分级方式有着一定的弊端,主要表现在以下几个方面。

    1.1电子邮件数据存储的成本较高

    在线存储多采用高速磁盘阵列等存储设备及高端存储系统和技术如:SAN、点对点直连技术、S2A等。这些高端存储系统具有一些“高端”属性,高容量、高性能、高可用性、冗余性等。在电子邮件数据收集的过程中,需要一定的自动化软件作支撑,WindowsLiveMailDesktop、KooMail、IncrediMail、Foxmail、Mozilla Thunderbird、Outlook Express和MailWasher等,这些都需要增加投资,提高电子邮件存储的成本。

    1.2分级过分依赖于访问率高低

    把访问量不大的电子邮件数据转移到存储性能稍低的磁盘(如IDE或SATA接口磁盘)或光盘存储设备上,其目的是减轻电子邮件数据存储的压力。但这样做并不合理,因为根据档案的保管期限划分标准并不是以“利用的频率”作为唯一标准。决定档案保管期限的因素:一是档案价值的大小,或者说档案重要程度的高低;二是档案价值发生作用的时间范围。同时,在较短时间内对工作有参考利用价值的文件材料,列为短期保存,而在较长时间内对工作具有查考利用价值的档案,则列为长期以上保存。因此,电子邮件数据访问量并不能成为存储与归档分级的唯一标准。

    1.3相关信息具有后验性的特点①

    对于电子邮件管理系统,并不能从接受电子邮件数据始端就能判断电子邮件访问率的高低,仅仅依靠经验判断将电子邮件数据存储在某一层次的存储设备上并不科学。而且,短期内访问率高的电子邮件数据并不代表它的使用价值就大。

    1.4不同厂商的数据访问难以自动迁移

    目前尽管有许多厂商都推出了相应产品支持电子邮件数据自动迁移,但从技术角度来看,对于同一厂商的存储产品实现电子邮件数据间的自动迁移并不困难,而不同厂商之间的存储产品实现电子邮件数据自动迁移就有一定的局限性,这要考虑到数据迁移频度对电子邮件系统运行的稳定是否有影响。

    2 电子邮件分级存储与归档的保障目标

    1940年,美国档案学者菲利普·布鲁克斯最早提出了“文件生命周期”概念。“文件生命周期”指的是文件从产生直至因丧失作用而被销毁或者因具有长远历史价值而被档案馆永久保存的整体运动过程。引入“文件生命周期”概念的目的是强调文件运动的一种时间跨度,表明文件具有从最初形成到最终销毁或永久保存的整体运动过程。电子邮件作为电子文件的重要组成部分,文件生命周期理论同样适用于电子邮件的存储与归档。

    2.1确保电子邮件的可用性

    电子邮件的可用性是指电子邮件的数据与电子邮件系统在任何情况下都能够在满足基本需求的前提下被使用的特性。这一特性反映在物理安全、运行安全层面上,确保信息网络与重要电子邮件系统的正常运行,包括保障电子邮件的正常传递,保证电子邮件系统正常提供服务等,反映出电子邮件系统的可用性的基本属性。保证合法用户对电子邮件的使用不会被不正当地拒绝。

    2.2确保电子邮件的可控性

    电子邮件的可控性是指在电子邮件系统中加强对电子邮件的监测与控制。互联网上针对电子邮件的主动监测、过滤、限制、阻断等控制能力,反映出电子邮件及电子邮件系统的可控性的基本属性。在电子政务、电子商务中表现为电子邮件系统对电子邮件服务和电子邮件的访问具有很强的控制能力。

    2.3确保电子邮件的机密性

    电子邮件机密性反映在电子邮件具有不被非授权解析,电子邮件信息系统不被非授权使用的特性。这一特性反映在物理安全、运行安全、数据安全层面上,保证电子邮件数据即使被黑客捕获也不会被解析,保证电子邮件系统即使被访问也不能够越权访问与其身份不相符的信息,达到电子邮件机密性保障目标的实现。

    2.4确保电子邮件的完整性

    电子邮件完整性是指电子邮件数据信息不被篡改的特性,即电子邮件在存储和传输过程中保持不被非法修改和破坏,并且能够判别出电子邮件数据是否已被改变。其目的是保证政务信息、商务信息处于一种完整和未受损状态,在数据安全层面上,确保电子邮件系统中所传输的电子邮件数据的完整性。

    2.5确保电子邮件的真实性

    电子邮件真实性是指电子邮件系统在交互运行中确保并确认电子邮件的来源以及电子邮件发布者的真实可信及不可否认的特性。这一特性反映在运行安全、数据安全层面上,保证电子邮件交互双方身份的真实可信、以及交互电子邮件数据及其来源的真实可信。在电子政务、电子商务中要实现的目标是任何电子邮件的提供者和其使用者双方都要建立有效的责任机制,防止用户否认其行为。

    3 电子邮件分级存储与归档方案的实施

    在电子政务、电子商务等活动中,电子邮件作为发布信息、传递文件的重要渠道,其数据保护是其关键。但是,并非所有的电子邮件数据都具有同样的价值,也并非所有的政府、企事业单位都具有同样的需求。电子邮件数据的存储与归档目的“是将当前高效运行的网络、计算机和信息系统中长期呆滞的数据从当前在线存储系统中剥离出来,以减轻现行系统的运行负担,提高系统的服务性能和运行效率。”②

    3.1电子邮件的鉴定

    根据电子邮件的内容确定其是否具有公文性质,是否具有保存价值。对于涉及公务但以个人名义收发的电子邮件应视为公务电子邮件。对于公务电子邮件保管期限和密级的划分工作,参照国家有关纸质文件材料的保管期限和密级的有关规定执行。另外,档案部门必须对需要归档的公务电子邮件进行真实性、完整性、有效性鉴定。为拒绝垃圾邮件,首先要查看发件人的IP,查询收到的电子邮件IP所属的区域。其次,如果网站上有计数器,同时可以参考一下计数器里面的IP记录,查看该IP是否浏览过收件方的网站。第三,查看电子邮件发来的时间,根据时差判断发送电子邮件的时间是否准确。第四,查看电子邮件里面是否留下详细的联系资料,如果有网址、详细电话、传真地址等,一般比较可信。第五,分析电子邮件的内容是否有价值。

    3.2电子邮件的分级

    电子邮件分级就是要将用户拥有的所有存储资源统一管理,提高每种存储设备的利用率,节约成本。在分级过程中,存储的分级是十分明显的,仅从设备上说,就有磁带机、磁带库、NAS、中低端盘阵、高端存储系统等等。对于电子邮件数据的存储,采用分级别进行,在保持对归档数据可访问的前提下,根据电子邮件内容的具体情况和保管期限,结合档案分类方案,把电子邮件按不同级别存储到硬盘或磁带上。对重要的电子邮件,具有永久保存价值的将电子邮件数据存储在一级硬盘;对于比较重要,具有长期保存价值的电子邮件数据存储在二级硬盘。同时,也应把电子邮件数据保存拷贝在磁带上,因为相对于硬盘来说磁带的成本低得多。

    3.3电子邮件的存储

    OE全称Microsoft Outlook Express,这是微软公司出品的邮件管理程序,功能强大。该软件已经整合在IE浏览器中。在OE程序里,默认的邮件文件夹地址在系统盘,但重装电脑的时候很容易丢失该程序,所以正常情况应将电子邮件存储到非系统盘。另外,在OE里面,按照单位名称、邮件类别、地区等有关选项新建电子邮件的存储文件夹,并将相关的电子邮件存储到对应的文件夹里面。定期将电子邮件内容整理出来,也可以打印以纸质档案的形式同时保存。

    3.4电子邮件的归档

    电子邮件归档作为文件生命周期管理中不可缺少的一环,就是要把需要长期存储却又不会被经常访问的数据迁移到更经济合理的存储介质上,在需要时又能及时检索,从而降低系统的整体拥有成本,简化存储管理。根据《公务电子邮件归档与管理规则》的有关规定,“办理完毕且具有保存价值的电子邮件应及时从原有邮箱中迁移出来,进行逻辑归档,保存到专门的电子文件管理系统中。”③需要注意的是,采用物理归档的公务电子邮件应采用或转换为规定的标准格式进行归档,有些电子邮件的存储格式无法完整、准确地转换,应将相关的应用程序同时归档。

    总之,在电子邮件存储与数据归档中,文件生命周期管理的理念同样适用于电子邮件的管理,它能帮助政府、企事业单位科学有效地加强对电子邮件的管理,以最低的成本来实现电子邮件大量数据的有效管理与高效利用。随着通讯技术、网络技术等现代技术在电子邮件归档系统中应用的成熟,数据加密、身份认证、虚拟化等技术也逐步走进电子邮件存储与归档的应用中,有效地提高了电子邮件存储与归档应用的效率,使电子邮件的存储与归档做到既科学规范又节约高效。

    盐城师范学院2012年度校级教授、博士基金项目(项目编号为:12YSYJB0107)《基于文件管理的电子邮件归档研究》阶段性研究成果。

    注释:

    ①傅佳.基于应用等级的存储分级管理策略[J].中国金融电脑,2012(1):72-74.

    ②陈永生,薛四新.基于分级存储的数字化档案利用模式研究[J].档案学研究,2006(5):33-37.

    ③国家档案局.中华人民共和国档案行业标准DA/T32-2005公务电子邮件归档与管理规则[J].中国档案,2006(1):41-43.作者单位:盐城师范学院

相关文章!
  • 基于企业文化的国企思想政治工

    陈广梅中图分类号:D641 文献标识:A 文章编号:1674-1145(2019)4-081-02摘 要 新形势下,党对国有企业思想政治工作提出更高的要求,需要

  • 一次为中国革命延续火种的伟大

    朱强今年11月12日是我国伟大的革命先行者孙中山先生诞辰150周年。在孙中山先生早期的革命生涯中,有一段流亡海外的经历,这段经历见证了

  • 周强:在县域治理中发挥好司法

    大数据时代,司法案件运行情况成为县域经济社会发展的晴雨表。法院将海量案件信息进行大数据分析,从刑事案件判断治安状况,从民商事案件