• 工作总结
  • 工作计划
  • 读后感
  • 发言稿
  • 心得体会
  • 思想汇报
  • 述职报告
  • 作文大全
  • 教学设计
  • 不忘初心
  • 打黑除恶
  • 党课下载
  • 主题教育
  • 谈话记录
  • 申请书
  • 对照材料
  • 自查报告
  • 整改报告
  • 脱贫攻坚
  • 党建材料
  • 观后感
  • 评语
  • 口号
  • 规章制度
  • 事迹材料
  • 策划方案
  • 工作汇报
  • 讲话稿
  • 公文范文
  • 致辞稿
  • 调查报告
  • 学习强国
  • 疫情防控
  • 振兴乡镇
  • 工作要点
  • 治国理政
  • 十九届五中全会
  • 教育整顿
  • 党史学习
  • 建党100周
  • 当前位置: 蜗牛文摘网 > 实用文档 > 公文范文 > 支持向量机和决策树算法在滚动轴承故障诊断中的应用

    支持向量机和决策树算法在滚动轴承故障诊断中的应用

    时间:2023-04-20 20:05:05 来源:千叶帆 本文已影响

    孔祥媖

    (重庆交通大学机电与车辆工程学院,重庆 400074)

    滚动轴承是风力发电机等大型机械设备的重要零部件,其性能状态直接影响机械设备的安全稳定运行。及时、准确的故障诊断对制定针对性维护计划,延长使用寿命,提高机械系统可靠性有重要意义。因此,滚动轴承故障诊断的研究具有重要意义[1]。

    在滚动轴承故障诊断领域,信号采集技术、计算能力,特别是人工智能和机器学习技术的进步,使诊断更加自动化。基于机器学习的故障诊断范式可分为3个阶段:数据采集、特征提取和模式识别。

    第1阶段,从安装在设备中的传感器收集信号,以获得有关其状态的定量信息。其中,振动信号最常用于轴承故障诊断[2]。

    第2阶段,在时域、频域或时频域[3]中处理收集的信号,以提取可能代表轴承状态的属性(或特征)。例如,属性是统计指标、自回归模型系数、分解为奇异值[4]等。这些属性被收集到一个低维向量中(远小于所收集信号的样本数),作为下一步分类的输入。

    第3阶段,使用专门用于模式分类的算法读取属性并进行诊断,这通常在训练步骤后完成。在训练步骤中,调整算法以从机器操作历史中识别不同的操作模式。在滚动轴承故障诊断的背景下,已经使用了一些算法来实现,例如决策树[5]、k近邻(k-NN)[6]、朴素贝叶斯分类器和支持向量机(SVM)[7]等算法。

    SVM技术具有良好的泛化性,并且有着坚实的理论基础,已成功应用于各种分类问题,如字符和对象识别。SVM分类器通常针对二进制问题进行训练,其中只需要区分两类(“缺陷”和“非缺陷”),但也可以针对多类问题进行调整(使用“全反一”策略)。

    决策树算法则是一种基于树的知识方法,用于表示分类规则。用C4.5算法生成的标准树由多个分支、1个根、多个节点和多个叶子组成。1个分支是从根到叶的节点链;
    每个节点涉及1个属性。树中属性的出现提供了有关相关属性重要性的信息。

    本文利用SVM算法和决策树算法,使用DC竞赛轴承故障检测数据集对其在滚动轴承故障诊断中的使用效果进行对比分析,通过观察4个评价指标对2个模型进行综合评估,结果表明,SVM能更为准确地对滚动轴承进行故障诊断。

    SVM分类器条目是要分类的对象的属性向量。该算法的输出是一个分数,其信号(正或负)描述测试向量是否属于每个感兴趣的类别,该分数直接作为检测类别的标签呈现给用户。

    SVM是一种二元识别模型。它的目的是找到一个最优超平面段样品,以便最大化之间的距离最近的点的空间和本身,算法如下。

    给定1个训练集:

    D={(x1,y1),(x2,y2),(x3,y3),…,(xi,yi)},yi∈{-1,1}

    (1)

    超平面可以用函数表示:

    f(x)=wTx+b

    (2)

    如果f(x)为0,样本点落在超平面。当f(x)超过0时,y的值为1。如果f(x)的值小于0,则y的值为-1。其中y只是一个标签,为了便于描述,y的范围是{-1,1}。

    (3)

    当wTx+t的值大于1或小于-1时,更支持。空间中任意采样点X到超平面的距离用r表示:

    (4)

    也就是说,SVM的最终目标是使分类区间最大化。集成学习是将多个弱分类器结合一定的策略来生成一个强分类器。Bagging算法是一种基于均匀概率分布对数据集进行重复采样(带放回)的方法。每个新数据集都具有与初始数据集相同的维度。

    决策树用于衡量特征贡献程度的算法有3种,分别为信息增益(ID3)、信息增益率(C4.5)和基尼指数(Gini index)。CART采用的是基尼指数最小化准则,即用基尼指数选择最优特征,同时决定该特征的最优二值切分点。基尼指数表示在样本集合中1个随机选中的样本被分错的概率,指数越小表示集合中选中样本被分错的概率越小,集合的纯度越高,反之集合越不纯。在分类问题中,假设一共有M个类别,样本点属于第m类的概率为pm,则该概率分布的基尼指数为:

    (5)

    式(5)表示概率的不确定性。对于二分类问题,若样本属于其中某一类的概率是p,则:

    Gini(p)=2p(1-p)

    (6)

    在遍历特征集合寻找各个特征的切分点时,假设数据集被属性划分成了D1和D22个子集,则在属性的条件下数据集的基尼指数计算如下:

    (7)

    3.1 数据介绍

    本文的研究数据来自DC竞赛轴承故障检测数据集,由id(样本编号)、6 000个轴承震动信号以及label组成。其中,label指该样本轴承是否出现故障,label为0时为正常,label为1时为故障。整个数据集有792个样本,其中正常轴承有177个样本,故障轴承有615个样本,label分布如图1所示。

    图1 label分布

    3.2 数据处理

    按照8:2的比例划分训练集与测试集,通过观察label分布,可以发现数据存在不平衡的现象,采用SMOTE过采样方法对训练集进行处理,从而解决类样本不平衡问题,处理完毕后label为0和1的样本均为492个。

    3.3 基于SVM的轴承故障诊断

    将训练集输入SVM模型进行训练,模型选择SVM.SVC,参数均为默认,模型训练完毕后用测试集进行预测,预测情况如混淆矩阵所示(见图2)。

    图2 SVM混淆矩阵

    通过观察混淆矩阵可以发现,label为0的样本全部判断正确,label为1的样本有15个误判,剩下的108个样本判断正确。

    图3为ROC曲线,ROC曲线图是反映敏感性与特异性之间关系的曲线。横坐标x轴为1-特异性,也称为假阳性率(误报率),x轴越接近零准确率越高;
    纵坐标y轴称为敏感度,也称为真阳性率(敏感度),y轴越大代表准确率越好。总的来说,AUC的值越接近1效果越好。通过ROC曲线图可以发现AUC的值为0.939,效果较好。

    图3 ROC曲线

    3.4 基于决策树的轴承故障诊断

    将训练集输入决策树模型进行训练,参数均为默认,模型训练完毕后用测试集进行预测,预测情况如混淆矩阵所示(见图4)。

    图4 决策树混淆矩阵

    通过观察决策树混淆矩阵可以发现,label为0的样本中有10个误判为1,剩下的10个样本预测正确,label为1的样本有12个误判,剩下的111个样本判断正确。通过观察ROC曲线,AUC的值为0.812,如图5所示。

    图5 决策树ROC曲线

    3.5 模型评估

    为了进一步评价SVM和决策树模型的性能,采用如下指标对测试集进行评价,包括精确率(PRE)、召回率(Recall)和准确率(ACC)。指标的定义如下:

    (8)

    (9)

    (10)

    式中:TP表示正确识别的阳性样本数量;
    TN表示正确识别的阴性样本数量;
    FN表示错误识别的阳性样本数量;
    FP表示识别错误的阴性样本数量。

    SVM模型的测试结果如表1所示,从以上4个评价指标来看,SVM能起到很好的预测效果。

    表1 SVM和决策树模型评估

    本文利用轴承振动信号数值特征来进行建模,以实现轴承故障诊断。在建模过程中用SMOTE过采样方法来解决训练集不平衡的现象,通过观察4个指标,可以发现SVM有较好的预测效果,准确率达到了91%,能够对轴承的故障诊断提供有效的参考。

    猜你喜欢基尼决策树分类器Wimbledon Tennis考试与评价·高二版(2021年1期)2021-09-10一种针对不均衡数据集的SVM决策树算法成都信息工程大学学报(2019年3期)2019-09-25决策树和随机森林方法在管理决策中的应用电子制作(2018年16期)2018-09-26卷入选战的布基尼环球人物(2017年7期)2017-04-17加权空-谱与最近邻分类器相结合的高光谱图像分类光学精密工程(2016年4期)2016-11-07结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器光学精密工程(2016年3期)2016-11-07强制“脱衫”环球时报(2016-08-25)2016-08-25基于决策树的出租车乘客出行目的识别中央民族大学学报(自然科学版)(2016年4期)2016-06-27基于肺癌CT的决策树模型在肺癌诊断中的应用郑州大学学报(医学版)(2015年1期)2015-02-27基于LLE降维和BP_Adaboost分类器的GIS局部放电模式识别电测与仪表(2014年15期)2014-04-04
    相关热词搜索:向量算法故障诊断

    • 名人名言
    • 伤感文章
    • 短文摘抄
    • 散文
    • 亲情
    • 感悟
    • 心灵鸡汤