VPMCD

2024-07-21

VPMCD(精选3篇)

VPMCD 篇1

0引言

机械装置中滚动轴承、齿轮箱是常用的重要部件,其安全、可靠运行关系到企业的生产效率、 经济效益以及质量和安全。神经网络、支持向量机等现代故障诊断方法在轴承、齿轮箱的诊断中得到了广泛的应用[1,2,3]。但人工神经网络存在局部极小点、收敛速度慢等缺陷,支持向量机分类则受到核函数及参数的影响。Raghuraj等[4,5,6]提出了基于变量预测模型的模式识别( variable predicive model based class discriminate,VPMCD) 方法, 通过对各特征量间内在关系建立数学模型来进行模式识别,并将其成功应用于生物学的模式分类问题中。目前VPMCD在机械故障诊断中,采用ITD[7,8]、EMD[9]、EEMD等方法通过模式分解得到固有模式分量,再从某些分量中获得VPMCD中的变量,以达到一定的分类效果。

本文提出采用时序分析建模[10]提取故障特征,结合VPMCD方法进行诊断,并以实例验证其实用性及优越性。

1VPMCD方法

VPMCD方法假设描述系统特征的特征量间存在一定的内在关系。设采用p个不同的特征量X = ( X1,X2,…,Xp) 来描述一种故障,这p个特征量之间可能存在一对一的关系X1= f( X2) ,或者一对多的关系X1= f( X2,X3,…) 。VPMCD方法利用训练样本建立表征特征量关系的变量预测模型,通过该模型预测各特征量,以各特征量预测误差的平方和最小为判别函数进行分类。

对于p个特征量Xi( i = 1,2,…,p) ,建立以下四种模型:

( 1) 线性模型( L) :

( 2) 线性交互模型( LI) :

( 3) 二次交互模型( QI) :

( 4) 二次模型( Q) :

其中,r为模型阶数,r ≤ p - 1; p为特征量Xi的个数; b0、bj、bj j、bj k为模型参数。

用p个特征量Xj( j ≠ i) 对Xi进行预测,有

式( 5) 称为特征量Xi的变量预测模型 ( variable predictive model) Mi。

对于某一类故障,若模型类型、阶数以及对Xi的预测变量确定,则模型参数b0,bj,bj j,bj k可通过解n( n为训练样本数) 个方程的线性方程组得到:

式中,D为n × q设计矩阵; B为参数矩阵。

对每k类故障,在模型类型和阶数确定时,根据预测变量Xj的不同组合,可得到Crp -1种特征量Xi的变量预测模型Mik,依据拟合误差平方和最小,从中找出一个最优的Mik,即最优的Mik的目标函数为

对于g类故障,经训练可以建立g × p个Mik( k ·= 1,2,…,g) 。

基于VPMCD方法的识别过程如下: 1对测试样本提取其特征量X = ( X1,X2,…,Xp) ; 2对测试样本的特征量Xi分别采用g × p个Mik进行预测,得到预测量 ^Xik; 3计算所有特征预测值的误差平方和Sk,并用下式

判别,当Sk最小时,将测试样本识别为第k类。

2AR-VPMCD故障诊断法

时序分析方法为基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律, 该方法在动态数据建模及预测预报,尤其在对短数据序列的分析方面有着不可替代的优势。ARMA模型( 特别是其中的AR模型) 是时序方法中最基本的、实际应用最广的一种时序模型,可解释动态数据本身的结构与规律,预测其未来值。

本文提出一种新的故障诊断方法———基于时序分析AR模型的VPMCD( AR-VPMCD) 法,该方法充分利用时序模型的建模与预测优势,结合VPMCD进行机械故障诊断。AR-VPMCD机械故障诊断步骤如下:

( 1) AR建模。对监测信号建立AR( n) 模型。采用AIC、FPE等准则确定模型阶数。

( 2) 特征提取。取AR( n) 模型自回归参数 φ1,φ2,…,φn作为训练样本和测试样本的特征量,用于训练Mi和测试分类,即特征向量为

( 3) 训练变量预测模型。将特征向量X分别代入VPMCD四种模型,得到n个方程组成的线性方程组( 式( 6) ) ,利用梯度下降法得到最小误差平方和的近似最优解B = ( DTD)-1DTXi。

( 4) 模式识别与分类。将测试样本分别代入g × p个Mik中,得到预测量 ik,计算每一类故障中所有特征预测值的误差平方和Sk,当Sk最小时,将测试样本识别为第k类。

3AR-VPMCD法应用实例

3.1滚动轴承故障诊断应用

采用西储大学的驱动端轴承振动加速度信号数据,该实验台如图1所示。故障轴承型号为SKF6205,其垂直方向安装一振动加速度传感器, 信号采样频率为12 k Hz。轴承故障有四种: 正常工况、内圈故障、滚动体故障、外圈6∶ 00方向故障。轴承故障 为用电火 花加工的 单点径向0. 18 mm的损伤。

将实验数据分为两部分: 训练样本和测试样本。每种工况选取训练样本30组,单个样本长度有64个采样点; 测试样本30组,单个样本长度有64个采样点。图2所示为内圈故障工况的训练样本。

对每组训练样本进行AR建模,利用AIC、 FPE准则得到模型阶数为6,建立AR ( 6 ) 模型。 提取AR( 6) 的6个自回归参数作为故障特征量。 图3、图4分别为内圈故障工况的一组训练样本及其AR模型定阶图。事实上,根据经验,时序模型前几阶的系数影响较大,工程实际中只要建立6 ~ 8阶AR模型即可满足机械系统的建模需要。

反复建模测试表明,二次交互模型为本次试验的最优VPM模型,模型阶数选为特征量个数减一。任选一组测试样本的识别结果见表1,各状态下由训练样本训练得到的预测模型见表2。

为了方便比较,采用EMD对信号进行前端处理以提取特征量( 简称EMD -VPMCD) ,即将每个样本信号通过EMD分解,得到频率由高到低的IMF分量,提取每个样本信号的峭度指标最高的一阶IMF分量( 冲击最明显的层) 的峭度、峰值因数、裕度、偏度4个特征参数作为故障特征量,再使用VPMCD方法进行故障类型识别。

同理,将上述AR -VPMCD法中6个自回归参数作为故障特征量,采用KNN算法( k -nearest neighbor algorithm) 对故障类型进行识别 ( 简称AR -KNN) 。

对比三种处理方法的故障识别正确率和计算时间,结果见表3。

注: CPU 为 Intel Core 2 Duo,内存为 2GB,操作系统 Windows( 32 位)

3.2齿轮故障诊断应用

本实验室的齿轮箱实验台由Simens的Micro Master420变频控制器控制齿轮箱驱动电机的转速,齿轮箱输入轴通过联轴器和电机连接,传感器为加速度传感器,安装在齿轮箱的轴端。实验的数据采集由test系统完成,分别采集正常工况、 均匀磨损和非均匀磨损的齿轮振动加速度信号, 采样频率为2 k Hz,采样点数为4096。

将实验数据分为两部分: 训练样本和测试样本。每种工况选取训练样本30组,单个样本长度有128个采样点; 测试样本30组,单个样本长度有128个采样点。

使用AR-VPMCD、EMD-VPMCD和AR-KNN三种故障诊断方法,其各自故障识别正确率和所需训练时间结果见表3。表3表明,本文提出的AR-VPMCD故障诊断方法具有很好的诊断精度和实用价值。

4结论

( 1) 本文提出了基于时序分析AR模型的VPMCD的故障诊断方法,该方法充分利用了时序分析的动态建模与预测预报优势。

( 2) 与基于EMD的VPMCD法和基于AR模型的KNN法进行了对比,表明本文提出的AR-VPMCD法可以较快地得到识别精度更高的结果。

( 3) 由于AR建模可用于短数据建模,因此, 本文方法不仅计算速度快,而且适用范围更广,利于辨识快速变化的工况。

VPMCD 篇2

葡萄干营养价值丰富,美味可口,受到全国人民青睐。目前,葡萄干的品质检测主要分为外部和内部检测两类,内部检测主要是对其味道、糖分、水分的检测,检测技术已经比较成熟;外部检测方法主要是对颜色、形状、大小及表面缺陷的检测,检测技术不够成熟,仍需进一步研究,如何对大批量葡萄干进行实时检测,成为研究的关键,迅速有效的检测方法对我国的葡萄干进出口贸易有促进作用。目前农产品识别、分级检测技术日趋成熟,检测方法多种多样,其中神经网络技术应用较为广泛[1,2,3],数据挖掘算法[4]、基于稀疏表示的分类算法[5]也在各类识别中应用,识别精度成为比较各种算法优劣的关键。

VPMCD方法是一种基于变量预测模型的模式识别方法,它认为不同类别的系统中,全部或者部分特征之间存在一定的内在关系,根据这种关系建立数学模型,采集研究对象的数据,对模型参数进行训练可以得到预测模型,利用预测模型可以对各类对象进行预测分类[6]。目前,这种方法在滚动轴承故障诊断、机械故障诊断、齿轮故障诊断及其他的一些故障诊断中应用较为广泛[7,8,9,10],在农产品等级检测中尚未应用。试验中尝试采用VPMCD方法对葡萄干进行等级检测。

1 研究对象与方法

1.1 研究对象

以新疆绿无核葡萄干作为研究对象,分别选取三个等级(一级、二级、三级)的葡萄干各100粒,其中,每个等级各40粒作为训练样本,剩余60粒作为测试样本。

1.2 研究方法

设计适宜的照明装置,选择合适的照明条件,采集三个等级葡萄干图像后进行图像预处理,提取出单个葡萄干图像,图1为采集的原始一级葡萄干图像,进行图像去噪、背景分割、轮廓跟踪后,提取出单个葡萄干图像。对所有样本的单个葡萄干图像,提取颜色及形状特征,编写人工神经网络算法进行试验,选择识别率较高的特征组合作为识别参数,利用VPMCD方法进行等级测试。研究流程如图2所示。

2 葡萄干特征提取

2.1 颜色特征

颜色是葡萄干等级识别的最主要特征,一级葡萄干颜色碧绿且着色均匀,试验前需要选择合适的颜色模型,提取葡萄干的颜色特征。HSI颜色模型以人眼的视觉特征为基础,使用色调(H)、饱和度(S)、亮度(I)来表示颜色,与人观察颜色的感觉最相似,因此,在获取了葡萄干的24位的真彩色图像后,利用转换公式,需将RGB模型转换为HSI颜色模型,提取H,S,I三个颜色特征。

2.2 形状特征

形状特征能够反映出葡萄干的大小、外形特征,一级葡萄干往往粒大且饱满,提取合适的形状特征也是分级的关键。试验中,提取了单个葡萄干图像的周长(P)、面积(A)、长轴(L)、短轴(M)、长宽比(W)、圆形度(C)六个基本形状特征。

提取了葡萄干样本的特征数据后,应初步筛选识别特征,由表1中三个等级各40粒葡萄干样本的特征均值可以看出,在长宽比、圆形度特征上,三个等级数据差别甚微,原因在于同品种的葡萄晾制的葡萄干外形较为相似,因此,这两个特征不能作为识别的有效特征,初步选定色调(H)、饱和度(S)、亮度(I)、周长(P)、面积(A)、长度(L)、宽度(M)七个特征参数参与人工神经网络训练识别。

葡萄干样本的各个特征物理意义和取值范围不同,需进行数值归一化处理,使其处于同一量纲之中,试验中采用极值归一化方法处理。设采集样本中有N个葡萄干图像,特征向量的维数为I,第n个图像的第i个特征值为ln,i,将向量li中每个元素的数值归一化到[0,1]范围。极值归一化公式为:

式中:min(li)为采集样本中图像的第i个特征向量li的最小值;max(li)为采集样本中图像的第i个特征向量li的最大值。

3 采用人工神经网络进行特征优选

人工神经网络是模拟生物神经网络进行信息处理的一种数学模型。试验中,采用BP神经网络模型,利用Matlab编写程序,构建了具有一个隐含层的三层网络模型,输入层节点数采用特征参数个数,初步选定为7个,输出节点为3个,对应3个等级的葡萄干,初始学习速率为0.01,目标误差采用0.001。采用双曲正切函数tansig作为隐含层激活函数、对数S型激活函数logsig作为输出层激活函数,网络输出值在0和1之间。

(1)确定识别率较高的网络结构。根据对测试样本的识别准确率,选取识别率较高的网络结构,如表2所示为各种网络结构下样本的识别率。由表2可以看出,输入层为7、隐含层为17、输出层为3时识别率较高,且训练速度也相对较快。

(2)选取最优特征组合。各个特征在识别中所起作用不同,特征少、识别效率高是算法追求的目标。试验中,在确定了网络结构后,通过对不同特征参数组合下识别率的比较,选取最佳特征组合。不同参数组合识别率的比较如表3所示。可以看出,使用色度(H)、面积(A)、长度(L)、宽度(M)4个特征组合识别率最高,训练速度快,因此选择这4个特征作为最终识别特征。

4 基于VPMCD的等级检测算法

在农产品的等级检测中,神经网络、支持向量机(SVM)等检测识别方法没有考虑到对象特征间的相互内在关系。VPMCD方法根据这种关系,对不同类别对象建立不同的数学模型,利用这些数学模型对测试样本特征值进行预测,根据预测结果对农产品进行分级。因此,在处理非线性分类问题时,VPMCD方法避免了神经网络的迭代过程,大大减少了计算量和训练时间。

试验中,对每个训练样本提取色度、面积、长度、宽度4个特征值,根据特征值之间的非线性特性,选用二次交互模型QI[11],建立预测模型;提取每个测试样本特征向量作为测试数据。利用VPMCD方法进行等级检测分为模型训练和模型分级两个过程,具体如下:

(1)模型训练过程:

(1)在三个等级的葡萄干中,共收集n个训练样本(n=120),每一等级分别有nk(k=1,2,3)个样本。

(2)提取训练样本4个特征向量X=[X1,X2,X3,X4]。

(3)对任意被预测变量Xi(i=1,2,…,4),选择二次交互模型(QI)。

(4)令k=1,对于k等级的nk个训练样本中的任意一个,对其每个特征值Xi建立数学模型,得到nk个方程,用最小二乘法对这nk个方程的模型参数进行估计,得到各特征值Xi的预测模型VPMik。

(5)令k=k+1,循环步骤(4),直至k=3结束。此时对各等级葡萄干的所有特征值都分别建立了预测模型VPMik,模型训练过程结束。

(2)模型分级过程:

(1)提取测试样本葡萄干特征值X=[X1,X2,…,X4];

(2)对于测试样本所有特征值Xi(i=1,2,…,4),分别采用VPMik(k=1,2,3)进行预测,得到测试值ik;

(3)在同一等级下,计算所有特征值的预测误差平方和值δk(k=1,2,3),分级时,当预测样本中所有δk第k个最小时,将测试样本识别为第k等级。

5 试验及分析

利用Matlab编程实现了BP神经网络方法、支持向量机(SVM)和VPMCD识别算法。对40个训练样本进行训练,并对60个测试样本进行了识别。识别精度与SVM,BP神经网络识别比较如表4所示,在一级葡萄干识别中,识别精度及识别时间如表5所示。

试验中,BP神经网络与SVM中的多个参数需要经过若干次优化确定,而在VPMCD方法中,训练样本的特征值预测误差平方和最小即为最佳预测模型,分级时就以测试样本预测误差平方和最小来判定属于哪个等级。结果表明,该方法不但识别精度高于其他两种方法,且由于避免了神经网络中结构和类型的选择、迭代学习的过程,SVM中参数寻优过程,运算时间也大大减小,因此,VPMCD方法在葡萄干的等级检测中是一种可行且有效的模式识别方法。

6 结论

采用BP神经网络进行特征优选,对葡萄干提取的9个特征参数进行训练,通过对比识别精度,确定了最佳网络结构及最佳特征组合,选用色度、面积、长度、宽度作为最终识别特征。该文提出一种基于VPMCD对葡萄干进行等级检测的新方法,试验结果显示,提出方法识别率达到100%,将识别结果与使用BP神经网络和SVM识别做了比较,结果表明,VPMCD方法不论在识别率还是训练时间上,均优于其他两种方法。试验证明,VPMCD方法运算时间少、识别精度高,在农产品等级检测中可行且有效,为等级检测提供了一个新途径。

摘要:为了准确鉴别葡萄干等级,提出一种基于人工神经网络和VPMCD的葡萄干等级检测新方法。以新疆绿无核三个等级的葡萄干作为研究对象,提取颜色、形状的特征参数。采用BP神经网络算法,对比各特征组合对识别率的影响,确定了识别率较高的4个特征参数组合。最后应用VPMCD方法进行样本训练并进行葡萄干等级检测。将提出的方法与SVM、BP神经网络识别结果进行对比分析,结果表明,VPMCD算法识别率达到100%,分级效果明显,运算时间少,识别精度高,为农产品等级检测提供了一个新途径。

关键词:葡萄干,等级检测,BP神经网络,VPMCD

参考文献

[1]詹映,罗华平,彭云发,等.BP人工神经网络南疆红枣颜色分级方法的研究[J].食品工业,2015,36(1):165-167.

[2]李国进,董第永,陈双.基于计算机视觉的芒果检测与分级研究[J].农机化研究,2015(10):13-18.

[3]杨眉,魏鸿磊,华顺刚.一种基于神经网络的扇贝图像识别方法[J].大连海洋大学学报,2014,29(1):70-74.

[4]张昭,罗文亮,乔永亮,等.基于数据挖掘算法的竹块颜色分级研究[J].中国农机化学报,2013,34(2):217-220.

[5]向金海,杨申,樊恒,等.基于稀疏表示的烤烟烟叶品质分级研究[J].农业机械学报,2013,44(11):287-292.

[6]杨宇,王欢欢,曾鸣,等.基于变量预测模型的模式识别方法在滚动轴承故障诊断中的应用[J].湖南大学学报(自然科学版),2013,40(3):36-40.

[7]程军圣,马兴伟,杨宇.基于ICA相关系数和VPMCD的滚动轴承故障诊断[J].振动、测试与诊断,2015,35(4):645-648.

[8]贾民平,韩冰.改进VPMCD法及其在机械故障诊断中的应用[J].中国机械工程,2015,26(14):1861-1865.

[9]许有才,万舟.基于条件局部均值分解与变量预测模型的轴承故障诊断方法[J].计算机应用,2015,35(9):2606-2610.

[10]李葵,范玉刚,吴建德.基于MRSVD和VPMCD的轴承故障智能诊断方法研究[J].计算机工程与应用,2016,52(8):153-157.

VPMCD 篇3

关键词:多尺度高阶奇异谱熵,基于变量预测模型分类识别,遗传算法,转子系统,故障诊断

0 引言

存在局部故障的转子系统表现出二次相位耦合非线性动力学特性[1], 此时, 传感器获取的故障振动信号为非高斯、非线性时间序列。奇异谱分析 (singular spectrum analysis, SSA) 自被引入非线性动力学领域以来, 在故障诊断领域得到了广泛应用[2,3,4,5]。但奇异谱分析是基于二阶统计的协方差矩阵的方法, 所以本质上是一种线性分析方法, 很难有效地刻画转子故障振动信号的非线性特性。高阶统计分析不但具有很强的抑制高斯噪声的能力, 而且可以同时反映信号的频率、幅值和相位信息, 成为非线性时间序列分析的有力工具[6,7,8,9,10]。文献[11]将高阶统计分析与奇异谱分析结合起来, 提出了基于高阶累积的高阶奇异谱分析方法。Henon LorenZ和logistic等模型的分析表明, 高阶奇异谱分析比奇异谱分析能更有效地反映非线性时间序列的本质特征, 且在不同时延、嵌入维数和有噪声的情况下表现出较好的鲁棒性。

信息熵是信号复杂性和无规则程度的量度, 可以有效地反映机械故障的非线性特征[12,13]。笔者针对转子故障振动信号的非高斯、非线性特征, 对高阶奇异谱熵引入尺度因子, 提出多尺度高阶奇异谱熵的概念, 并将其用于转子故障特征提取。实验结果表明, 多尺度高阶奇异谱熵比传统单一尺度的高阶奇异谱熵包含更多的时间模式信息。

转子的故障诊断实质上是对故障模式的分类识别。采用不同的分类识别方法进行故障诊断时, 诊断的准确率和稳定性均存在较大差别。目前, 常用的分类识别方法有线性判别分析 (linear discriminate analysis, LDA) 、神经网络 (ANN) 、支持向量机 (support vector machine, SVM) 等, 但这些方法都存在各自的局限性[14,15,16,17,18]。由于从原始数据中提取的全部或部分特征值之间存在一定的内在关系, 且不同的故障类别、特征值之间的内在关系有着明显的区别, 故可利用这些内在关系进行分类识别。基于变量预测模型的分类识别 (variable predictive model-based class discriminate, VPMCD) 方法是一种利用特征值之间的内在关系进行分类识别的新方法。VPMCD相对于LDA、ANN、SVM等分类器具有诸多的优势[19,20,21]。但VPMCD方法在模型类型选择上存在明显的主观性。研究表明, 采用不同类型的模型时, 分类差异较大。为了将VPMCD方法引入小样本多分类转子故障诊断, 针对VPMCD方法模型选择的问题, 提出了基于GA-VPMCD (variable predictive model based class discriminate and genetic algorithm) 故障诊断方法, 即首先采用不同类型的模型对测试样本进行预测, 然后利用遗传算法融合测试样本的预测值, 最后以预测误差平方和构建判别函数来实现分类识别。

基于以上分析, 结合特征提取和分类识别, 本文提出了基于多尺度高阶奇异谱熵和GA-VPMCD的转子故障诊断方法, 最后通过对转子的不平衡、不对中、动静件碰摩和油膜涡动4种故障的诊断试验验证方法的有效性和优越性。

1 多尺度高阶奇异谱熵

1.1 高阶奇异谱熵

在转子故障诊断中, 反映故障信息的振动信号为非线性离散时间序列{x (1) , x (2) , …, x (N) }。若采用嵌入时延法将N点的时间序列{x (1) , x (2) , …, x (N) }进行相空间重构, 则可以得到m×n (m>n) 维重构吸引子轨道矩阵X。由奇异值分解理论知:对于m×n维的矩阵X, 必然存在一个m×l维的矩阵U、一个l×l维的矩阵Λ和一个n×l维的矩阵V, 使得下式成立:

若λ1≥λ2≥…≥λl≥0, 则λ1, λ2, …, λl称为矩阵X的奇异谱。对角矩阵Λ的非零主对角线元素的个数反映信号所含频率成分的复杂程度。假设矩阵Λ有k (k≤l) 个非零主对角线元素, k越大, 信号频率成分越复杂, 相反亦然。由此可见, 奇异谱是转子信号信息量的客观反映。

转子系统的振动状态是由系统输入和系统本身的状态决定的, 当转子系统出现故障时, 振动信号的复杂性将发生明显的改变。信息熵可以对信号或系统状态的不确定性或复杂度进行有效的定量评价。基于信息熵概念, 定义离散时间序列{x (1) , x (2) , …, x (N) }奇异谱熵为

从定义可知, 奇异谱熵能表达信号的复杂性和不确定性, 即信号越复杂, 奇异谱熵越大。当转子系统存在不同类型故障时, 由传感器获取的振动信号所含的频率成分就会明显不同, 从而导致奇异谱熵会有较大的差别。

奇异谱分析是基于二阶统计的协方差矩阵的方法, 本质上是一种线性分析方法, 很难有效地刻画转子故障振动信号的非线性特性。高阶统计分析不但可以抑制加性高斯噪声, 而且保留了信号的相位信息, 能体现系统的非线性结构。从高阶的角度来分析转子故障信号, 可以获取更多的内在信息。高阶统计包括高阶矩、高阶累计量和高阶矩谱、高阶谱。因此, 以高阶统计量序列取代原始信号的离散时间序列来求取的奇异谱熵, 能更好地揭示信号的本质特征。本文定义高阶统计量序列的奇异谱熵为高阶奇异谱熵。工程应用中, 高阶统计分析主要应用高阶累计量和高阶谱, 其中以三阶累计量和双谱为最常用的分析方法[6, 10, 22?23]。本文采用三阶累积量的对角切片序列来进行奇异谱熵计算。三阶累积量为

令τ1=τ2, 得到三阶累积量的对角切片:

1.2 多尺度高阶奇异谱熵的特征提取

在进行奇异谱熵分析时, 本文引入尺度因子, 提出了多尺度奇异谱熵概念。对长度为N的离散序列{x (1) , x (2) , …, x (N) }, 建立新的粗粒向量[24]:

其中, τ为尺度因子。显然, τ=1时, yj (1) 就是原始时间序列;τ≠1时, 原始序列{x (1) , x (2) , …, x (N) }被分割成τ段, 每段长为N/τ的粗粒序列{yτ (1) , yτ (2) , …, yτ (N/τ) }。对每一个粗粒序列进行奇异谱分析, 得到粗粒序列的奇异谱熵值。此时, 奇异谱熵值为尺度因子τ的函数, 称为多尺度奇异谱熵分析。多尺度奇异谱熵定义为时间序列在不同尺度因子下的奇异谱熵, 能反映时间序列在不同尺度因子下能量分布的复杂性。如果一个序列的熵值在大部分尺度上都比另一个序列的熵值大, 那么前者比后者复杂性更高。如果一个时间序列的熵值随着尺度因子递增而单调递增, 那么, 该序列结构相对较复杂, 在大尺度因子上包含较多信息。

多尺度高阶奇异谱熵计算过程如下:

(1) 对于离散时间序列{x (1) , x (2) , …, x (N) }, 计算三阶累积量的对角切片{c (1) , c (2) , …, c (N) }数据序列。三阶累积量的对角切片的详细计算过程参见文献[23]。

(2) 引入尺度因子τ=1, 2, …, m (m为最大时间尺度) 。在不同时间尺度上, 对{c (1) , c (2) , …, c (N) }数据序列建立粗粒向量 (yτ (1) , yτ (2) , …, yτ (N) ) , 对该粗粒向量进行奇异值分解, 并按式 (2) 进行奇异值谱熵计算, 得到不同尺度上高阶奇异值谱熵值[H1H2…Hm]。

2 GA-VPMCD

2.1 VPMCD简介

对于有p个特征变量x= (x1, x2, …, xp) 、g个类别的分类问题, VPMCD方法首先选择线性模型 (L模型) 、线性交互模型 (LI模型) 、二次交互模型 (QI模型) 、二次模型 (Q模型) 四种类型模型其中的一个, 并确定模型阶数r, 通过样本训练建立反映特征值相互内在关系的数学模型Mik (k=1, 2, …, g) , 这种数学模型被称为变量预测模型 (variable predictive model, VPM) , 这个过程即所谓的在模型建立过程;然后在分类阶段, 采用Mik对被测试样本的特征变量值进行预测, 最后以预测误差平方和构建判别函数来实现分类识别。详细的VPMCD方法请参见文献[19-21]。

2.2 GA?VPMCD方法及其应用

2.2.1 GA-VPMCD方法

在转子故障诊断中, 采用合适的信号处理方法得到p个特征变量x1, x2, …, xp。假设故障状态有g个类别, 且任何样本均属于g个类别中的一种类别。第k (k=1, 2, …, g) 类训练样本的任一特征变量记为xik, 训练时, 分别选取不同模型阶数r=1, 2, …, p-1并与L模型、LI模型、QI模型、Q模型进行组合, 通过训练得到N个弱VPM, 记做Mik={Mi1, k, Mi2, k, …, MiN, k}。

对于任一测试样本, 假设该测试样本为第k类, 采用N个Min, k分别对xi进行预测为第k类、第n个Min, k对第i特征变量的预测值。由于弱VPM的模型类型的选择存在一定的主观随意性, 所以Min, k只能在某种程度的反映特征变量之间的内在关系。基于融合诊断思想, GA-VPMCD采用遗传算法优化Min, k的权值Wik= (wi1, k, wi2, k, …, wiN, k) , 其中, win, k为第n个弱VPM对第k类、第i个变量预测值的最优权值, 然后对进行加权融合, 得到最佳加权最佳预测值

假设测试样本属于第k类时, Min, k对x= (x1, x2, …, xp) 的预测值矩阵为

遗传算法优化得到的最优权值矩阵为

则利用Wk加权融合后的得到测试样本的最佳预测值:

理论上, 若测试样本属于第k类故障, 则预测误差平方和最小。反之, 预测误差很大。所以, 在分类阶段, 采用测试样本的预测误差平方和Ek最小为判别函数来实现故障分类识别。当Ek最小时, 将测试样本识别为第k类:

2.2.2 基于GA的弱VPM权值矩阵的优化

GA-VPMCD采用遗传算法优化各个弱VPM的权值Wik。首先将权值编码为染色体串, 然后在搜索空间通过选择、复制、交叉和变异四种遗传操作寻找到最优权值。染色体串的编码方式目前包括二进制法和实数法等, 本文采用二进制法, 即将权值编码为二进制染色体串。染色体串的组合方式如图1所示, 其中每个权值均为10位二进制串, 假设有N个Min, k, 则每个个体的长度为10 N位。遗传算法随机产生初始种群, 然后依据个体适应度值, 通过选择、复制、交叉和变异对个体进行筛选和进化, 不断更新种群。新的种群继承了上一代的信息又优于上一代, 如此反复迭代, 直至在在搜索空间筛选出最优解。

VPMCD以测试样本的预测误差平方和Ek最小为判别函数来实现故障分类识别, 故以预测误差矩阵2-范数为遗传算法的目标函数, 以目标函数的倒数作为适应度函数, 即适应度函数为

本文采用轮盘赌法进行选择操作, 根据概率决定每个染色体是否被复制到下一代, 每个个体被选中概率为

式中, M为每代的种群中个体的数目。

个体适应度越大, 该个体被选中的概率越大。遗传算法通过选择、交叉、变异, 不断地进化更新种群, 直到搜索至最优解。

3 转子故障诊断方法

基于多尺度高阶奇异谱熵和GA-VPMCD的转子故障诊断包括以下内容: (1) 多尺度高阶奇异谱熵特征提取; (2) 利用样本训练N个Min, k; (3) 遗传算法优化最优权值矩阵Wik; (4) 采用N个Min, k预测测试样本的特征变量, 用最优权值矩阵融合得到最佳特征变量预测值; (5) VPMCD分类识别各种故障状态。故障诊断流程如图2所示。

4 应用实例

为了验证方法的有效性, 在ZT-3型转子实验台上模拟转子不平衡、不对中、动静件碰摩和油膜涡动4种类型故障。用电涡流传感器采集转子径向位移振动信号, 转子转速为3000r/min, 分别采集正常、不平衡、不对中、动静件碰摩和油膜涡动五种状态的实验数据各20组。采样频率为4096Hz, 采样长度为1024点。图3所示为不同状态的转子振动信号时域波形。

按照1.2节所述的方法, 对5种状态100个样本分别进行多尺度特征提取。实验数据分析时, 取嵌入维数m=20, 时延参数J=1, 对原始信号的三阶累积量对角切片进行相空间重构, 然后分别提取时间尺度因子τ=1, 2, …, 5的高阶奇异谱熵[H1H2…H5], 实验数据见表1。从表1可见, 不同状态振动信号各个尺度因子的高阶奇异谱熵均有着比较明显的不同。转子动静件碰摩状态下, 高阶奇异谱熵最大。这是因为动静件之间的碰摩会产生冲击, 从而激发高频非线性振动, 导致振动信号能量分布的不确定性最大。在旋转机械中, 转子不平衡的主要原因是轴弯曲, 转子高速运转时, 轴弯曲使转子和静子间发生摩擦, 振动更为突出和不平稳[25], 所以转子不平衡信号的高阶奇异谱熵较大。对于油膜振荡, 振动信号成分主要集中在0.41~0.51倍频的范围内, 能量最集中, 所以存在油膜振荡故障时, 振动信号高阶奇异谱熵最小[12]。不对中状态下的转子振动可简化为有参数激振和强迫激振的非线性非自治系统[25], 振动信号存在二次相位耦合, 包含比较丰富的频率成分, 所以不对中信号高阶奇异谱熵大于油膜振荡信号的高阶奇异谱熵。

注:amin、amax、amean分别为熵的最小值、最大值和均值。

但值得注意的是, 对于任何一类故障, 由于采集的时刻不同, 高阶奇异谱熵存在一定的变化范围。从表1可见, 在任一尺度下, 不同故障的高阶奇异谱熵的变化范围存在一定的重叠, 所以用单一尺度的高阶奇异谱熵很难准确地判断故障类型。但是, 从表1可以看出, 多尺度高阶奇异谱熵能衡量时间序列在不同尺度因子下能量分布的复杂性, 各种故障信号的多尺度高阶奇异谱不但能区分故障类型, 而且随尺度因子的增加而递增。相比单一尺度的高阶奇异谱熵, 多尺度高阶奇异谱包含更多的信息。为了阐述GA-VPMCD的优越性, 首先沿用文献[19-21]的VPMCD方法, 选取r=3的L模型VPM (1, 3) 、r=3的LI模型VPM (2, 3) 、r=2的QI模型VPM (3, 2) 、r=3的Q模型VPM (4, 3) , 采用随机抽取训练样本 (样本数为5×7) 和测试样本 (样本数为5×13) , 实验结果见表2。4种故障诊断模型的诊断精度差异较大, VPM (1, 3) 和VPM (3, 2) 识别精度相对较低, VPM (2, 3) 和VPM (4, 3) 模型平均识别精度相对较高, 诊断效果尚可, 但不理想。因此, 为克服模型选择对分类精度的影响, 采用本文提出GA-VPMCD来进行转子故障诊断。本次试验中随机抽取正常、不平衡、不对中、动静件碰摩和油膜涡动状态各7个样本作为训练样本。分别采用r=3的L模型VPM (1, 3) 、r=3的LI模型VPM (2, 3) 、r=2的QI模型VPM (3, 2) 、r=3的Q模型VPM (4, 3) , 利用样本训练得到每个特征变量的4种弱VPM。随后, 用遗传算法优化各种模型的权值矩阵W1~W4。遗传算法优化参数见表3。限于篇幅, 表4仅仅列出了转子不平衡状态下, 经训练和遗传算法优化的特征变量H1的4种弱变量预测模型及最优权值。

试验将剩余的65个样本做为测试样本, 检验方法的可行性和优越性。基于GA-VPMCD的测试诊断结果见表5。采用GA-VPMCD方法后, 不平衡、不对中、动静件碰摩和油膜涡动故障均全部识别, 13个正常样本中有2个误识为不对中, 综合分类识别精度提高到了96.92%, 相比任何单一模型, 诊断精度和泛化能力得到了明显地提高。

5 结论

(1) 针对转子故障振动信号的非高斯、非线性特性, 提出了多尺度高阶奇异谱熵的概念。研究表明:多尺度高阶奇异谱熵包含更多的时间模式信息, 能有效地反映转子故障类型。

(2) 针对传统分类识别方法的不足和VPM-CD分类识别方法的模型选择问题, 提出了GA-VPMCD分类识别方法。研究表明, GA-VPMCD能有效地应用于多分类小样本的故障诊断, 有利于实现在线多分类机械故障诊断。

(3) 结合特征提取和分类识别方法, 本文提出了基于多尺度高阶奇异谱熵和GA-VPMCD的转子故障诊断方法, 试验结果表明该方法有效可行。

【VPMCD】推荐阅读:

上一篇:支付宝下一篇:公司合理避税

本站热搜

    相关推荐