基于序列模式挖掘的警用车辆维修数据分析模型研究
占善华++徐金成
摘 要:文章结合笔者单位实际情况,深入分析了当前司法行政系统内警用车辆的维修数据,并结合其他系统车辆维修所面临的问题,提出了基于序列模式挖掘的警用车辆维修数据分析模型,使其在警用车辆维修数据中可以得到运用。对促进机关事业单位车改以及警用车辆维修管理的决策有重要的现实意义。
关键词:序列模式;数据挖掘;警用车辆;模型分析
车辆维修是一个特殊的行业,有其特殊性,任何一辆车在进行了某个部件的维修后,鉴于厂家或者维修部门的保障期限,在保障期或者某一短时间内是无需进行相同部件的同样的维修服务。不过如果是警用车辆的维修,由于车辆的出勤率,势必会导致其特殊的维修次数和周期,常年累月的的维修管理数据可能揭示出潜在较严重的问题,如有一些车辆维修费用高;有些车辆维修次数多;短期内部分车辆存在多次维修同种问题的情况等。鉴于警用车辆维修管理数据的特殊性,应该有一个分析模型去分析,从而得出潜在的问题,做到未雨绸缪。
1 序列模式挖掘步骤
序列模式挖掘的步骤如图1所示,我们可以看到,总体上分为三个不相同的步骤。它们依次顺序为:数据预处理→知识库形成→可视化。
2 基于序列模式挖掘的警用车辆维修数据分析模型结构介绍
通过数据采集模块警用车辆维护数据挖掘模型的序列模式,数据预处理模块,挖掘序列模式挖掘模块,该模块包括以下几个部分。警用车辆维修数据采集模块用于采集数据进行分析;数据预处理将采集的数据为标准,统一的数据格式;序列模式挖掘的模型和算法的核心部分,挖掘的完整规范的预处理,统一的数据格式与相关的序列模式挖掘和序列模式评估模块;分析显示在图形和表格形式的挖掘挖掘结果评估结果。
模型的体系结构如图2所示。
3 模型组件介绍
3.1 数据提取
警用车辆维修系统是一个非常复杂和庞大的信息管理系统,包含复杂的业务逻辑和数据库连接存在十分复杂的数据库表。然而,使用已经运行,所以在这个极其复杂的巨系统数据库中积累了大量的业务数据,但这些数据库中的数据不是数据挖掘的警用车辆使用数据,我们需要提取相应的数据提取操作相关的数据。
警用车辆维修系统,维修车的应用需要上传维修报价,包含报价信息,车牌号码,车辆识别代码,汽车维修零件清单,以及相应的价格和其他相关信息。此信息存储在相应的数据库中的表,需要提取。
3.2 数据预处理
由于各种主观和客观的或不可抗拒的原因,数据提取过程中得到的数据往往是不一致的,多余的,不完整的现象,直接的数据序列模式挖掘几乎是不可能的。数据清洗的需要,数据采集,通过操作上收集到的数据预处理数据的一系列操作,能满足要求的序列模式挖掘。数据质量是数据预处理的改进,当然,也可能会丢失数据的一部分,但有助于提高准确度和后期的序列模式挖掘性能。
警察的车辆维修制度,车辆保养的记录到数据挖掘算法的属性数据,可以处理的数据格式,例如价格序列数据库中的值为离散的区间值数据库的维护将使用中国维修配件消耗属性表示,可以转换成该算法直接操作字符或字符代码,等等。经过数据情况好或不好,会影响精度的数据预处理,提取相关规则非常到位下推导和结果的有效性。
3.3 序列模式挖掘
序列模式挖掘算法模块采用改进的序列模式挖掘,一个处理好进一步挖掘数据的步骤。期待的消耗部件之间的关系提出找警察车辆维修事件,和资金账单每个警察车辆修理在特征提取的事件之间的相关性,比如和维修时间的相关性。
3.4 挖掘结果评估
对序列模式挖掘算法挖掘出来的结果进行评估,评估应用于该模型的改进的序列模式挖掘算法的优势与特征。
观察序列模式挖掘的警用车辆维修相关属性的关联性是否有效,以及算法是否更优秀。
4 结语
主要工作在于提出了警用车辆维修数据的序列模式挖掘模型,并介绍了该模型中所具有的组件:即数据收集模块、数据预处理模块、序列模式挖掘模块、挖掘结果评估模块在整个模型中所做的工作。提出了基于序列模式挖掘的警用车辆维修数据分析模型,但还未实际应用于实践中,后续工作将用于提高挖掘效率并应用于实践。
[参考文献]
[1]周斌,吴泉源.序列模式挖掘的一种渐进式算法[J].计算机学报,1999,22(10):882-887.
[2]李云,刘学诚,朱峰.数据挖掘技术在入侵检测中的应用[J].计算机应用与软件,2011,28(5):117-119.
[3]马进,金茂菁,杨永丽,等.基于序列模式挖掘的隐私保护多步攻击关联算法[J].清华大学学报,2012,52(10):1427-1434.
[4]HANJW,KamberM,PeiJ.数据挖掘概念与技术[M].北京:机械工业出版社,2012:278-284.
[5]蒋盛益,李霞,郑琪.数据挖掘原理与实践[M].北京:电子工业出版社,2011:166-169.