2020年8月29日,为期三天的2020工业互联网大会在云端拉开帷幕。30日晚,伟德BETVlCTOR1946科技算法工程师胡翔受邀在“工业互联网新生代”议题上分享了他在第三届工业大数据创新竞赛上夺冠的经验,详细介绍转子部件脱落故障预测的内容。
以下是演讲内容整理。
我是来自伟德BETVlCTOR1946的算法工程师胡翔,今天给大家分享的是2019年第三届工业大数据创新竞赛的赛题内容——转子部件脱落故障预测,将从以下几个方面进行阐述:1. 赛题分析;2. 模型验证与模型优化;3. 总结展望。
2019届大赛赛题“大型高速旋转机组转子部件脱落故障预测”属于工业领域典型的异常检测和故障诊断问题。大型高速旋转机组一旦发生转子部件脱落问题,将会带来巨大的经济损失以及安全隐患。由于大型高速旋转机组转子部件脱落故障的早期特征难以捕捉,主办方希望通过运用大数据的分析方法来识别转子部件脱落和故障征兆强度。
初赛时组委会提供了5台机组数据用于训练,其中包含两台故障机组,同时另外提供5台机组数据用于测试。而决赛则需要识别8台机组的故障情况,包括两个预测目标:一是识别哪些机组发生了转子脱落故障,二是针对存在转子脱落故障的机组按照故障程度对所有数据进行排序。
在采样信息提取方面,每个机组提供6到7个测点的数据,包括联端径向X、联端径向Y等位移测点;同时机组还提供5个不同故障阶段即不同故障程度的数据。每个位移测点包含5个字段,如转子转动的周数、总采样点数、波形数组、采样频率、转速等。对每个测点数据进行分析,发现采样的旋转周数不变,为32转,采样的总样本量也不变,为1024个点,因此可得出结论是等角度采样而非等时间采样,采样率为32点/转。
在数据可视化方面,对位移波形进行FFT(Fast Fourier Transformation)变换之后可得阶次谱。通过对正常机组和故障机组的阶次谱进行分析发现,在转子脱落故障的不同阶段,正常机组的1X转频能量无明显变化,而故障机组随着故障的不断加剧,1X转频能量不断增加。
此外,对同一个测点X向和Y向的振动进行合成得到轴心轨迹。分析发现,正常机组的轴心轨迹在不同阶段几乎没有变化,而故障机组的轴心轨迹随着故障加剧变化明显。
经上述分析,我的解题思路主要分为两点,一是识别转子部件是否存在脱落,二是识别存在脱落故障机组的征兆强度。第一个问题可归结为二分类的问题,第二个问题的思路是通过分类概率大小来识别脱落故障的征兆强度。
之所以选择分类概率大小来识别脱落故障征兆强度,实际上是我通过对比三个不同的解题思路后得出的结论。第一个思路是通过特征融合的方法,形成单一指标指示脱落故障,但这只适合机理简单的场景,而大赛赛题属于典型的机理复杂场景;第二个思路是通过回归的方法,对训练集数据故障赋予不同的“征兆强度标签”,但由于赛题提供的数据存在时间上的中断,并且该数据集的样本属于小样本问题,回归方法效果不好;第三个思路是通过分类概率大小作为故障征兆强度的指标,该思路最符合此次大赛数据集特点,因此采用第三个思路。
在采样信息提取方面,每个机组提供6到7个测点的数据,包括联端径向X、联端径向Y等位移测点;同时机组还提供5个不同故障阶段即不同故障程度的数据。每个位移测点包含5个字段,如转子转动的周数、总采样点数、波形数组、采样频率、转速等。对每个测点数据进行分析,发现采样的旋转周数不变,为32转,采样的总样本量也不变,为1024个点,因此可得出结论是等角度采样而非等时间采样,采样率为32点/转。
在特征工程方面,提取时域特征和频域特征。时域特征包括位移峰峰值,频域特征包括1X、2X、3X转频的幅值,以及1X、2X、3X转频能量占比。
在建模数据的选择上,考虑到最接近故障发生的a组数据与实际故障数据最为相似,因此,以a组数据作为分类正例,而无故障的数据作为分类反例组成训练数据集进行建模。
在模型验证方面,选择LightGBM作为分类算法模型,然后通过五折交叉验证,同时在这个阶段需要保证验证集的数据来源平衡,最后根据验证结果优化分类阈值。在预测阶段实际上是取每一组数据集预测的最终统计结果作为最终结果。
在模型优化方面,主要从两个方向出发,一是特征优化和筛选,二是数据清洗。特征筛选包括两个点,一是特征在故障数据上的单调程度。下图是1X转频能量随着故障的演变劣化的趋势图,从图中可以看出,1X转频能量随着故障的劣化具有比较好的单调性。二是考虑特征在未知数据即未知工况上的泛化能力。由于无量纲特征不受工况影响,而有量纲特征受工况影响,因此建模过程中我删除了大部分有量纲特征,强化了模型的泛化能力。
在数据清洗方面,从实际数据分析发现,大机组的转速存在完全恒定无变化的情况,而从实际业务角度出发,大机组不可能存在转速完全无波动的情况,因此这部分数据为异常数据,将其进行清洗,不参与建模。
十分开心能获得第一名的好成绩,通过这次竞赛经历,我个人也有一些心得体会和大家分享。一是在分析问题时一定要从实际业务层面出发,业务理解对特征提取和使用具有决定性影响;二是合适的解题思路关系到解决方案的泛化能力;三是数据的预处理在整个过程中是第一步也是至关重要的一步。
此外,我认为在能够提供连续的故障程度数据的情况下,可尝试利用回归方法作为解决方案思路。本次比赛仅考虑了转子部件脱落这一个故障,但大型高速旋转机组在现实中往往存在非常多的故障模式,因此在实际过程中需重点分析多故障模式及考虑工况主要是转速的影响,这些都是非常值得去深入研究的。
以上就是我的分享内容,谢谢大家的聆听!