网站首页  词典首页

请输入您要查询的论文:

 

标题 大数据技术与档案数据挖掘
范文 李元锋
摘要:在大数据技术运用在档案管理的过程中,产生的最为显著的特点是档案数据的深度挖掘,这个显著特点可以显著的帮助档案管理发生以下几方面的改变:首先,档案管理的流程更加精细化;其次,细致化的档案资源和用户的需求之间的双向控制关系更进一步。
关键词:大数据技术;数据挖掘;档案管理
1前言
当前的时代是一个信息化的时代,也是一个数据化的时代,数据挖掘技术在档案管理过程中的运用得到进一步的加深。知识管理和知识的挖掘在很早之前就已经在档案界提出了,但是对知识挖掘的提出尚停留在概念的提出及初步理论的提出。已经有大量的数据证明,从大数据中进行知识的挖掘可以更加高效地解决数据与知识之间的鸿沟,这是许多档案管理者认为档案馆的传统业务将发生向数据分析和数据挖掘方面的转移,传统的档案信息服务底层将不再是进行知识的简单检索,而是进行智能化的深度数据挖掘。大数据时代的到来,给数据挖掘技术带来的改变最为显著的是为数据的深度挖掘提供了可能。对数据的深度挖掘过程中,不仅要注重数据挖掘的深度和广度,还要注重数据的全面性、可靠性和价值等。
2数据深度挖掘是大数据技术在档案管理中的主要特点
数据挖掘首先是对海量的数据进行建模,然后通过建好的模型对企业的大量数据进行整理和分析,从而帮助企业进行数据进行划分,包括客户的年龄段分析、市场分析、产品特征分析及技术手段分析等。对数据进行深度挖掘,不仅是数据建立模型的过程,也是探索数据中规律的过程。比如,档案管理人员在进行档案的编研选题过程中,不仅要深入调查用户使用档案数据过程中,使用的档案调卷数量、档案利用的次数、档案的复制次数、档案的制备数量等。此外,还要进行用户访问记录的深度挖掘,包括用户检索的关键词、下载的记录、用户运用网络的时间和频度等。通过这些数据建立用户模型,一方面可以根据不同的类型进行编研选题,另一方面可以通过用户需求分析来预测未来的发展趋向,总结出社会热点,总结出让档案编研部满意的编研成果。在进行档案的利用过程中,我们可以选取不同的方向进行建模,得出不同的档案利用形式的变化趋势,一些变化高的档案进行全文数字化,使之得到高效的利用,进而有效的保护档案的原件。从以上分析,我们不难看出,對档案的数据进行深度的挖掘是大数据时代的一大特点。档案管理进程中的每一次重大变革都对档案学的发展产生了重大的影响。比如在这个过程中引入的计算机和网络技术,让档案管理理念发生了重大的改变,让文件和档案的处理流程也发生了重大的转变。
3大数据技术有助于档案管理模式走向精细化
在传统的数据挖掘基础上进行大数据的挖掘,这个过程中使用的是数据仓库形式,进行了“泛关系”的分类模型的构造,在这个过程中采取了海量数据分析方法,进行的是传统数据挖掘方式的深化改革。现已有相关分析认为,大数据技术对数据的挖掘主要包括了一下几个过程:数据来源、数据的抽取和收集、数据的分析、数据的解释。
3.1档案数据质量更高
在数据收集过程中,是大数据技术处理的基础步骤,数据的质量直接影响大数据技术的效能,只有在高质量的数据前提下,大数据技术菜能发挥出它的作用。大数据具有实时l生和动态性,为了得到兼具两种特性的数据,进行数据采集的手段十分重要。数据采集过程中还要重视数据的来源,数据来源不同使得数据更具有现实意义。
3.2处理方式得到改进
现有的数据来源十分复杂,数据形式多样化,为使数据统计便于进行,我们有必要进行相应的数据处理。首先,将结构较为复杂的数据进行单一化转变,在互联网时代,数据呈现了半结构化和半结构化数据的增长,这些都是一些馆藏数据的重要来源。其次,还要对收集的数据进行筛选,保证数据的质量和可靠性。原始数据中可能掺杂着一些无效或多余的数据,因此,我们有必要进行数据的深处理。
3.3数据分析精细化
数据分析是大数据处理过程中的核心步骤,相关性分析是大数据处理过程中的一个重要思维模式,通过这种分析可以让我们更好的发现数据之间的密切联系。进行相关性分析的精细化,可以让数学档案资源得以活化,进行数据仓库价值的深入挖掘。进一步展现数据分析的价值,进行新知识的创造。
3.4服务更加精准,突出以人为本
对广大的档案用户而言,最重要的不是数据分析的过程而是结果以及相关的结石。档案用户需要的是明确精准的结果,否则,他们心中有疑惑,就容易产生困扰,甚至被误导。在档案管理信息系统中,进行相关数据的深化分析,让用户对未来的发展把握更深,更明确,从而做出更加准确有效的决策,这也是判断数据挖掘是否有价值的重要衡量标准。
4大数据技术对档案数据深度挖掘,让档案管理更加精细化
4.1档案资源挖掘
在档案管理中存在普遍的现象是对档案的管理比较重视,档案的运用较少,这就导致档案的价值没有得到发挥。为此,我们需要深度挖掘档案中的数据,让其中包含的数据价值得到发挥,产生新的价值。在进行数据挖掘过程中,我们首先要树立一个大档案的工作思路。要重视数据的整体性和完整性,将之完善成一个具体的体系;其次,我们要建立数据共享的资源库,可以以地级关系为依托,进行数据库的设立,是数据库之间的联系更加紧密;最后,利用当前的计算机技术和云服务,进行数据资源网的构建,为档案用户提供更好的服务平台。
4.2用户数据挖掘
对用户的数据进行深入挖掘可以帮助用户提升认同感,提高档案服务工作的价值。进行用户数据的深度挖掘主要包括以下几个方面:进行用户数据的深度挖掘,从用户留下的检索信息中提取他们的具体需求,推测他们的兴趣,进行统计,为用户提供人性化的服务。其次,对用户的点击率进行统计,将点击量高的档案进行数据化;进行检索词和关键词的细化和扩充,提高检索的效率,提升用户的满意度。
5实现数据深度挖掘的策略
5.1建立数据资源体系以及用户关系管理
建立一个完善的数字资源库,要求我们从以下几个方面做起:首先进行数据的扩容,进而构建完备的资源数据库,其次,加强数据化的资源建设,最后数据开放,有效提升数据的价值。
5.2保护客户隐私,完善大数据技术
大数据分析过程中,我们经常面临的问题主要包括技术层面的问题和人力层面的问题。在进行数据挖掘的过程中势必会牵涉到一些用户的因素问题,那么如何避免这些问题呢?首先健全法律保护,健全信息安全管理条例,还要使用可以保护用户隐私的数据挖掘方法,进行数据的合理挖掘。
6结语
综上所述,在大数据时代,我们不断的进行档案管理的创新。将大数据技术运用在档案管理的各个环节,使得在档案管理中大数据技术得到合理的运用,有效的推动了档案数据价值的发挥。技术文
随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/15 16:56:05