档案数据中“垃圾数据”问题分析

    王峥

    摘要:档案数据化这种方便、快捷、高效率的档案管理方式促进了各行各业的进步与发展。但,同样也遇到了前所未有的挑战,那就是“垃圾数据”的出现,这种看似正确实则错误的数据危害巨大,本文主要从垃圾数据的产生和如何清理垃圾数据入手进行分析,并提供有效措施。

    关键词:档案数据;垃圾数据;措施

    引言:“垃圾数据”这一常见现象正是伴随着数据信息化发展而来的棘手问题。“垃圾数据”直接影响了档案数据的有效性和运行效率,这对信息化管理的档案数据所产生的影响是深远的。如何对“垃圾数据”问题进行科学合理的解决是摆在档案管理行业前进道路上的一个急需面对的挑战。

    1.垃圾数据的含义

    想要理解垃圾数据的含义,首先要了“解档案数据库”的意义。档案数据库的概念要从两个维度进行阐述,首先是在前台计算机用户方面,档案数据库是一种“档案信息管理系统”,它主要是对基本的档案信息进行录入、显示和打印等,是最为常见的办公系统:其次是在后台计算机服务器方面,档案数据库是一种“数据库系统”,它主要是对档案数据进行存储和管理、维护等,是档案管理人员接触到的系统管理工具,为前台用户的档案检索和查阅提供平台和服务。

    档案数据的存储方式是以一种二维数据表格的形式进行,由行、列两部分组成,记录着基本的档案信息。在存储过程中,就要求行、列及其中的字段、数据等都有严格的格式标准和规则,以便于后期的有效检测和管理。垃圾数据的产生就与这有直接关系,当其中的某个记录或数据违反了既定的标准和规则时,就会直接导致数据库系统与档案信息管理系统在运算上出现错误”。这种数据就被称之为“垃圾数据”。

    2.垃圾数据的种类

    “垃圾数据”根据数据错误形式大致分为以下几种类型:

    2.1数据语法错误

    语法错误主要是指在录入阶段,当录入的数据不符合规定的数据类型时而出现的一种错误,这是一种较为常见的“垃圾数据”表现形式。例如,录入的信息应该是数字却填写成了文字,应该录入大写数字却填写成了小写数字等一类语法型错误。但这种“垃圾数据”比较容易辨别,也是最为低级的错误,只要认真检查,加强管理,出现的比例并不高。

    2.2数据逻辑错误

    逻辑错误数据主要表现形式是在“信息管理系统”中所输入的信息,表面上看其格式、字段等都没有问题,但实则与“数据库系统”程序的原始设计并不相符,这就会使得在存储和检索档案数据时无法正确运行数据。这种“逻辑式”错误数据往往是比较隐蔽的,只有数据库系统的相关管理人员通过认真检查核验才能够发现并及时预防,因此,这类垃圾数据是比较难发现和难清理的。

    2.3信息重复

    “重复式”垃圾数据是指在内容信息上重复,这种垃圾数据一般分为两种:一种是由于内容相同的数据会在程序排序的过程中出现集中排序的情况,从而导致重复:另一种是由于半角和全角符号使用混乱导致数据虽然内容相同,但最终显示出来却是不同的数据信息,这就导致数据信息重复。这种“垃圾”数据不能集中排序,文字符号又不同,所以很难被发现。

    3.垃圾数据的影响

    3.1影响数据库系统的稳定运行

    档案数据库系统均为程序开发设计人员先行设计好的系统,计算机会根据设计安排处理档案数据,一旦出现垃圾数据,计算机无法像人一样辨别和处理,它只会根据固有设计运行。“垃圾数据”出现会导致数据库系统运行不稳,系统退出、死机等情况就会出现,从而影响档案工作,带来诸多问题。

    3.2影响档案数据信息的检索

    档案数据管理系统在提供检索服务时,主要是根据检索关键字输入进行查找,而垃圾数据的存在直接导致检索者无法获得真实可靠的信息,或者检索不到信息。例如,出生年月为1986年李某,在档案录入中被写成了1976年,那么检索李某信息时就无法检索到他的档案或者检索到了但信息有误等。类似于此的“垃圾数据”影响了检索人员的信息检索,不仅对检索者本人造成一定的困扰,而且会对档案部门的工作带来一定的影响。

    3.3影响数据的统计分析

    档案数据化所带来的一个最直观的好处就是海量档案数据的存储和统计分析的便捷性和可靠性。但是这要建立在档案数据库系统中的数据是正确、无重复等错误的,一旦出现“垃圾数据”则必然会造成统计分析结果不正确,从而对整个档案管理工作以及由此产生的决策等产生影响。

    4.建议举措

    基于以上分析,要想避免“垃圾数据”问题的出现,首先要从源头上加强管理和监督。对档案管理人员及工作人员,要强化工作态度、工作职责等方面的教育,在基础录入、早期监督、中期维护和后期保障等方面加大投入力度,加强管理,层层强化,避免“垃圾数据”从源头上出现;其次是要严格制定标准和格式,避免出现重复数据和不必要的数据错误。例如,对半角和全角符号所应用的范围进行界定和划分,并严格执行,将会提高检索的效率。再次是对数据进行程序自行排查和人工排查相结合的纠正错误方式,对档案数据进行错误更正;最后是及时更新档案数据库系统,在程序开发中融入纠错、提醒和自行更正等功能,保证档案数据的准确性。

    结语:大数据时代所带来的档案信息化发展,为档案管理提供了巨大的发展潜力。但是伴随而来的“垃圾数据”影响巨大。“垃圾数据”的种类不同,解决方式不尽相同,但都需要程序设计者和档案管理者的共同努力,在源头和工作中将错误降到最低,提升档案管理水平、档案管理质量,满足当前各行各业的巨大档案服务需求。

相关文章!
  • 改进演示实验,提高演示实验教

    曹雪梅众所周知,化学是以实验为基础的学科.实验是化学的灵魂,也是提高学生学习兴趣的主要因素.教学实践证明,化学实验教学可以让学生

  • 素质教育在中职教育中的重要性

    杨天摘要:进入21世纪之后,素质教育已经成为全社会非常关注的一个重要话题。而在职业教育中,许多学生和家长错误的认为职业教育的本质就

  • 质谱法测定水中溶解氙的含量及

    李军杰+刘汉彬 张佳+韩娟+金贵善+张建锋<br />
    <br />
    <br />
    <br />
    摘要 利用设计的一套水样中提取并分离Xe的装置,与稀有气体质谱