标题 | 浅谈生产大数据在水口电站机组振摆度分析中的运用 |
范文 | 林乐麒 摘 要:针对水口电站水轮机振摆度振动数据,运用决策树模型,完成对机组振摆度的分析。 关键词:水电站;水轮机;状态检修;回归决策树 1、概述 目前,水口电站的监控系统、状态监测系统已经运行了十几年,它们已经积累了海量设备运行的数据。倘若采用传统分析方法对这海量的设备数据分析和处理,不仅费时费力并且难以从海量的数据中发现真正具有价值的信息。近年来,随着大数据、云计算技术的快速发展以及一些主流大数据算法框架的开放,大数据技术在日常生产中的运用已经逐渐成熟,利用大数据技术对水轮发电机组进行故障分析诊断已经十分必要。传统的方法只是通过机组定值的方式对机组工况进行简单的判定判定,但通过大数据分析可以分析机组各组特征数据的潜在规律,提前发现水轮发电机组运行工况的微妙变化,及早发现设备存在的缺陷及变化趋势。 2、基础数据 本文所用数据是由水口电站状态监测系统采集水口1号机组从2018年6月1日至2020年7月4日71031条稳态数据。监测变量包括上导X向摆度,上导Y向摆度,推力X向摆度,推力Y向摆度,水导X向摆度,水导Y向摆度,上机架X向水平振动,上机架Y向水平振动,上机架Z向垂直振动,顶盖X向水平振动,顶盖Y向水平振动,顶盖Z向垂直振动,定子X向水平振动,定子Y向水平振动,蜗壳差压,蜗壳进口压力,导叶出口压力,顶盖下水压力,尾水管出口压力,有功功率,导叶开度,桨叶开度,转速,工作水头,水导X向摆度6X,水导Y向摆度6X,顶盖X向水平振动6X,顶盖Y向水平振动6X,顶盖Z向垂直振动6X。由于数据参数过多,本文仅以上导X向摆度、推力X向摆度、水导X向摆度和蜗壳差压,有功功率,无功功率,等参数建立数据模型进行分析。 3、数据预处理 首先,进行数据清理,主要对数据中的缺失值以及异常值进行处理。由于机器学习算法对于数据的正确率要求比较高,噪声会对模型造成较大的影响。由于通信或者采集模块故障等原因造成有些采集值为空,对于这一类数据,因为占总样本比例比较小,所以以丢弃的方式处理。其次,由于数据中包含机组异常运行时数据,所以通过机组定值,删除包含异常值的数据。 4、数据建模 由于观察各个参数与振摆度不符合线性回归模型,所以采用决策树模型搭建预测分析模型。 4.1决策树模型原理 决策树是一种通过大数据训练,然后生产数据模型,对数据进行分类预测和回归预测的方法。通过的特征值的“是否”区分左右两个分支,不断迭代二分每个特征后而生成的模型。 假设X与y分别是输入矩阵和结果,并且y是连续变量,给定训练数据集 一個回归树对应着输入空间(即特征空间)的一个划分以及在划分的但单元上的输出值。假设已将输入空间划分为M个单元 ,并且在每个单元上有一个固定的输出值,于是回归树模型可表示为 决策树算法就是要不断找到信息熵最小的那个维度上(特征)值,这个值可以把目标值划分的类别信息熵最小。 Entropy代表信息熵,i 表示数据总类别数,P(i) 表示类别 i 样本数量占所有样本的比例 最后通过R^2进行模型正确率的评估 4.2决策树建模 本文选取的特征值比较少,只建立简单的决策树回归模型,并不进行参数调优的过程。 首先,将所有数据分为80%的训练集,以及20%的测试集。将80%的训练集训练生成决策树模型如下图: 4.3模型分析 由表1所示,上导X向摆度模型正确率明显低于推力X向、水导X向摆度模型。分析原因可能是由于引入特征量相对较少、上导X向传感器精确度相对较低造成数据误差较大。 从三个数据模型结果来看,机组不同地点震动的影响因素也不大相同。 a、上导X向摆度主要受到蜗壳压差蜗壳差压 <= 13.961这个主要条件进行影响,其次受到导叶开度与桨叶开度的影响。 b、推力X向摆度主要受到有功功率有功功率 <= 108.333这个主要条件影响,然后再根据有功功率 <= 25.699,有功功率 <=195.975两个条件进行划分。 c、水导X向摆度主要由受到蜗壳压差蜗壳差压 <= ?0.615这个主要条件进行影响,其次主要受到桨叶开度的影响。 5、结语 生产大数据在水口电站机组振摆度分析中具有巨大的作用,通过大数据技术可以发掘海量数据中的潜在价值,打破传统分析手段的限制,多维度的对机组机组工况、振摆度进行精确的分析。通过大数据技术对海量的数据进行分析,可以得到水轮机组运行中的客观规律,为故障判断、预测分析以及辅助决策提供更有价值的信息。通过大数据技术可以有效的降低事故的发生,做到防范于未然。从而有效降低水电站的运营成本,为企业创造更高效益。 (福建水口发电集团有限公司 ?350000) |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。