标题 | 关于档案管理方面的数据挖掘分析及应用探讨 |
范文 | 呼日乐 摘 要:随着计算机技术的不断发展和进步,人们的生活水平质量也逐渐提高。档案管理方面也开始应用计算机行业的数据挖掘技术,来提高档案管理效率,进而推动档案管理行业的发展。本文将从数据挖掘概念及形式入手,分析并探讨数据挖掘技术在档案管理方面的应用。 关键词:数据挖掘技术;档案管理;应用 引言 数据信息在人们的日常生活中扮演着重要的角色。数据可以组成若干事件、物体,甚至能够组成整个社会。其中,这些事件和物体之间也存在着错综复杂的关系,而数据挖掘技术便是要从所有数据中找到关系所在,并根据这些关系直接推断出来一些有价值且能够直接使用的信息,而非仅仅通过一些片面的数据信息进行定论。目前,档案管理行业应适应社会发展,运用数据挖掘技术,使人们实时获取所需信息,提高办公效率。本文主要对档案管理方面的数据挖掘技术的应用进行探讨。 一、数据挖掘技术的形式 数据挖掘技术的形式分为描述型和预测型。描述型是从现有的数据使用描述行为描述出存在的规则,进而发掘现有数据中更深层次的规律。预测型是从现有的数据中总结出共同点,同时对未来即将发生的事件进行预测。在数据挖掘技术的应用场景中,通常使用分类法、关联法和粗糙集法。 (一)分类法 分类法是数据挖掘技术的核心。分类的优劣不仅关系着数据不同属性的分析,而且会对数据质量产生较大的影响。分类法的主要操作流程如下:首先,对数据库中现有的数据根据不同属性进行分类。其次,对现有数据进行训练集和测试集的划分,保证训练量足够多,而测试量足够的少。最后,对数据进行测试,再根据不同属性进行二次分类。 (二)关联法 关联法在数据挖掘技术中不仅能够对现有数据的相关性进行详细的分析,而且能够精确描述出相关数据。该方法主要流程如下:首先,对现有数据进行详细描述。然后把属于同一属性的数据结合,并分析其相同点。这种方法不仅提高了数据的准确性,而且提升了整体工作效率。 (三)粗糙集法 粗糙集常用于研究不确定、不精确的知识。该方法在使用过程中需要注意以下几点:首先,使用前无需关注数据准确性。其次,在使用中,即使出现异常数据,也能够及时发现,并把处理过程中出现的数据干扰降到最低,同时能够以最快速度总结数据规律,供查询者使用。最后,在使用数据过程中会存在更大的不确定性,此时用粗糙集方法能够改善不确定性,提高效率。 二、数据挖掘技术在档案管理方面的应用 目前,在信息高速发展的社会,所有行业都追求更加高效、快速的办公节奏,档案信息管理行业也不例外。通过将数据挖掘技术应用到档案信息管理上,不仅能够提高效率,改善档案管理模式,而且能够充分发挥档案管理的价值。接下来将从以下几个方面来详细分析数据挖掘技术在档案管理方面的应用。 (一)档案分类 档案分类是指将所有档案按照不同的属性、功能进行归类,属于同一属性的档案放在一栏,不属于该属性的档案则放在另外一栏。如果使用人工分类的方法,不仅浪费大量人力物力,还会造成一定的误差,影响档案分类的准确性。因此,在档案分类时可以采用数据挖掘技术中的决策树。该方法能够对数据库的信息进行详细的分析,总结出一定的规则,并按照该规则对所有档案进行分类。决策树的实现步骤如下:首先,构建模型。在现有的数据库中把已经完成分类的数据筛选出来,对这些数据使用数据挖掘技术,构建相应的树模型。其次,运用模型。对上一步中未完成分类的数据,使用构建的模型进行分类。通过使用决策树方法,不仅方便查询者以最快速度找到自身需要的数据,而且能够对后续添加的数据快速归类。例如,查询者可以通过注册个人信息访问档案馆,同时数据挖掘技术将对访问者所有的浏览记录进行保存与分析,分析访问者的个人信息、喜好等等,进而推送出访问者接下来要查询的档案。这种方法能够在保证信息准确性的前提下,提高访问者的查询速度和档案馆的服务质量。 (二)档案收集 基于数据挖掘技术的档案收集是指对新的数据按照一定的规则进行对比,如果符合则进行归入数据库中的已有类别。具体过程如下:首先,建立模型。通过分析数据库中的已有数据,按照一定的规则建立模型。其次,使用该模型与新的数据进行差异对比,如果测试模型符合上一步建立的数据模型,那么将该数据放在测试模型中按照一定的规则进行归类。例如,档案管理者在网上发布课题让使用者进行调研,然后把使用者的个人信息以及调研结果依次输入数据库中进行保存。如果后续有新的调研小组将调研情况存入数据库中,数据挖掘技术将对该情况进行详细分析,以提高档案管理的服务质量和准确性。 (三)档案保留 档案保留是指,重点关注老员工的档案,将档案流失的可能性降到最低。对于企业来讲,培训新员工通常比聘请老员工付出的代价要高很多。因此,应当采用数据挖掘技术,首先把已经发生的档案流失情况进行收集,其次对所有档案流失的原因进行汇总并分析,然后针对这种现象采取相应措施,降低档案流失频率。总之,数据挖掘技术的应用,能够让档案管理工作更高效、更准确地执行,促进档案管理行业的快速发展。 三、结束语 综上所述,正是因为有了计算机行業的快速发展,档案管理行业才能够应用数据挖掘技术,通过使用分类法、关联法和粗糙集对档案实行快速且准确的管理。同时,将数据挖掘技术运用在档案的分类、收集和保留中,能够提高档案管理的高效性,而且能推动档案管理行业的进一步发展。 参考文献 [1]蒋红健.大数据挖掘管理与技术策略在高校档案馆中的应用研究[J].山西档案,2019(01):61-66. [2]陈雪燕,于英香.从档案管理走向档案数据管理:大数据时代下的档案管理范式转型[J].山西档案,2019(05):24-32. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。