标题 | 聚类支持下决策树模型在动车组空调故障检测中的应用 |
范文 | 王川 张珍文 安帅 摘 要:随着高铁的快速发展,人们对乘车环境的要求也越来越高。列车空调系统运行于列车高速振动环境下,性能极易下降且定期检修成本巨大,高效准确的空调故障检测尤为重要。本文用K-means聚类对空调数据进行分类,找到明显异常的类别并与业务部门确认后找到真正的空调系统故障数据,并对故障数据进行标记,利用CART决策树建立空调故障检测模型。 关键词:K-means;CART;空调故障检测 中图分类号:U266 文献标志码:A 0 引言 根据铁道部《客车空调三机检修及运用管理规程》规定:空调机组必须定时检修。但是定时检修耗费大量的人力物力,因此需要对空调数据进行分析,建立空调故障检测模型进行故障检测,進行针对性的检修,节约运营成本。 对于空调故障检测,潘文海等针对广州地铁3号线在运营期间频繁出现的客室闷热现象进行故障数据分析,最终确定故障点并据此进行整改,效果显著。罗浩在列车性能试验台采集到空调机组在正常及故障状态下的数据样本,建立几种常见故障的判断规则,依据故障规则判定表,利用MATLAB建立了SVM多分类器。 但是目前并没有有效的故障检测模型在线运行。本文针对列车运行状态空调数据,利用K-means聚类结合CART决策树算法进行空调故障建模,并用实际数据进行验证。 1 数据预处理 1.1 数据过滤 剔除掉NULL、异常、无效等数据。 1.2 指标筛选 目前所取数据指标较多,包括多个衍生指标,需要对指标进行相关性分析,选取与业务目标最相关的指标进行建模。 因为空调运行时,各个参数变化都与目标温度有关,此处计算各个参数与目标温度的相关性系数,结果见表1。 前6个指标的相关性系数大于0.6,与目标温度相关性较强。 1.3 数据标准化 温度与压力值量纲不同,数值相差很大,用Z-Score方法对数据进行标准化。 2 算法简介 由于目前没有空调故障样本,所以用无监督学习方法进行建模。空调运行正常与异常时,压力值以及温度表现出的规律不同,可以通过聚类发现空调数据内在的模式或者空调故障类的特点。 首先对空调数据进行聚类,分析各类的聚类中心,找出异常类别,与业务部门确认故障数据并对其进行标记,然后用分类算法进行分类,建立空调故障检测模型。 3 空调异常检测 3.1 模型训练 选取标准化后的某段时间的全量数据,共20列车608355条记录。 聚类效果可以通过肘部法则进行评估,肘部法则会把不同k值的成本函数值画出来。空调数据对应的聚类模型平均畸变程度随聚类个数k的变化趋势图如图1所示。 从图1可以看出,k值为5~6时,平均畸变程度变化最大。k超过6以后,平均畸变程度变化显著降低,因此肘部就是k=6。因此最终选择的模型为k=6对应的聚类模型。聚类模型的中心点见表2。 从聚类中心点可以看出,第5类的制冷系统2低压压力值明显异常,经与业务部门确认该类为压力传感器故障。 将第5类标记为1,其余类别标记为0,利用CART决策树进行分类,通过决策树模型结果可以看出,只要变量X[6]<=2720,就把空调归为正常数据,X[6]代表变量“制冷系统2低压压力”,由此抽象出空调故障检测的规则: 制冷系统2低压压力>2720kPa,则报出“空调压力异常”。 3.2 效果验证 将模型部署到PHM系统中,运行一段时间后确实检测到异常数据。与业务部门确认后,证实该数据确实为空调系统故障,但是是压力传感器故障,更换压力传感器,后期跟踪发现,该列车该车厢不再出现压力异常。 4 结论与展望 本文针对空调实际数据,利用K-means聚类算法找到异常类,对异常类别进行标记后,利用CART决策树进行分类,建立空调故障检测模型。本文建立的模型简单易实现,且效果良好,具有很强的实际意义。 由于没有真实空调系统故障数据,目前仅发现并建立了空调系统压力传感器故障模型,对于压缩机故障,滤网脏堵等空调系统故障,需要对数据进一步分析,建立全面可靠的空调故障检测模型,保证空调系统正常运行。 参考文献 [1]潘文海,苏锦华,李许磊,等.广州地铁3号线列车空调无制冷故障调查分析及解决[J].机车电传动,2013(3):56-57. [2]罗浩.列车空调机组故障检修中SVM的应用[D].华中科技大学,2008:1-61. [3]罗浩.列车空调机组故障检修中SVM的应用[D].湖北:华中科技大学,2008. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。