声目标识别

2024-10-13

声目标识别(共7篇)

声目标识别 篇1

无线传感器网络 (wireless sensor network, WSN) 以其大规模微小节点可自组网, 多跳路由通信, 协作感知以及能够隐蔽地零距离接触目标的特点, 在多种场合满足信息获取的实时性、准确性和全面性的要求, 弥补了雷达等其他大型传感器的探测盲区, 实现一定的战场态势感知, 为指挥信息系统提供了有效的信息。

基于无线传感器网络的目标识别研究也非常多, 其关键技术即目标的特征提取与分类识别一直是人们研究的重点和难点, 国内外对此进行了大量的研究工作, 如:文献[1]利用谐波集实现了对不同类型直升机的分类;文献[2]直接利用功率谱特征, 实现对战场车辆的分类;文献[3]利用降维后的功率谱特征, 实现了对战场四类目标的识别;文献[4, 5]用小波包能量特征实现了声目标的识别。战场上目标的声音信号构成非常复杂[6], 仅仅依靠某一特征, 很难全面反映其特征, 经常导致丢失其他重要的信息, 这就有必要利用多种互补的特征向量;即从不同方面完成对重要特征的描述, 从而有利于提高识别的正确概率, 降低错误概率。然而简单组合后的特征向量维数会非常庞大, 带来维数灾难, 不利于后续的分类识别。本文从无线传感器的实际特点出发, 提出对采集的声音信号用小波包去噪, 然后提取功率谱特征;并用核主分量分析 (kernel principal component analysis, KPCA) 对其进行降维处理, 再将降维处理后的特征与最优小波包提取的特征组成联合特征向量, 最后利用支持向量机 (support vector machine, SVM) 进行分类识别, 从而完成簇头中的本地决策。本文尝试对某型直升机、战斗机、巡航导弹、坦克和装甲车五种目标进行分类试验。其流程图如图1所示。

1 目标特性分析

目标的正确分类应建立在对目标的正确认识基础之上。首先深入分析目标特性, 然后进行数据处理和特征提取。

1.1 目标的噪声特性

1.1.1 直升机的噪声特性

文献[7, 8]和实测结果表明:直升机噪声是一种宽带信号, 能量主要集中在0~400 Hz的低频段, 其功率谱是由宽带连续谱上叠加一系列线谱组成, 如图2 (a) 所示。

1.1.2 战斗机的噪声特性

文献[9]和实测结果表明:战斗机的目标频率较低, 一般在500 Hz以下, 如图2 (b) 所示。

1.1.3 巡航导弹的噪声特性

文献[7]和实测结果表明:巡航导弹的飞行噪声主要为推进噪声和弹体噪声。推进噪声主要来自发动机, 其功率谱也呈现出鲜明的谐波特性。对于弹体噪声, 现在研究得较少。空气动力学原理分析表明: (1) 具有良好气动外形的弹体是一个宽带噪声源, 产生的噪声分布在一个150 Hz左右的低频峰值周围; (2) 弹体噪声强度与飞行速度之间呈5~6次方关系。当巡航导弹距测点位置较远时, 噪声高频成分明显衰减, 如图2 (c) 所示。

1.1.4 坦克的噪声特性

文献[10]和实测结果表明:主要频率在500 Hz以下, 如图2 (d) 所示。

1.1.5 机动车的噪声特性

机动车在正常速度行驶时, 高噪声辐射能量主要集中在400~1 000 Hz的频率段内, 如图2 (e) 所示。

1.2 数据预处理

数据预处理包括滤波和分帧。数据预处理的主要目的是提高信噪比, 减少后续处理的难度, 主要手段就是滤波。本文采用简单小波包去噪方法[11,12];即对采集的声信号进行小波包分解, 保留有用信号频率范围对应的小波包分解系数, 将剩余频率范围对应的小波包系数置0, 这样就消除了高频干扰噪声。实验中, 利用CC2530芯片设计的声音传感节点的采样率fs是11 k Hz, 由奈奎斯特采样定律可知, 经量化后有效信号的最高频率f为5.5k Hz。根据1.1节分析, 战场目标声音信号都在1 k Hz以下, 所以只需对5.5 k Hz的信号进行两级小波包分解。分解后的小波包系数为[C20, C21, C22, C23], 对应的频率范围分别为[0, f/4], [f/4, f/2], [f/2, 3f/4], [3f/4, f], 频段范围[0, f/4]即[0, 1 375 Hz]已经包含了目标信号的主要频谱范围。因此, 只保留系数C20, 将其他系数置0, 再进行信号重构, 这样就完成了信号去噪。

数据预处理的另外一个方面就是分帧。大量文献表明, 文中提到的五种目标在声音信号上存在很大差异, 频域波形必然能反映各自的特征;因此可采用功率谱对其进行特征提取。然而声音信号在统计上是非平稳的。也就是说, 它们统计特性是随时间变化, 无法直接利用原始信号进行功率谱估计。为了更好地利用平稳信号处理的成熟工具———功率谱进行特征提取, 必须将原始时间信号划分帧, 保证每一帧的时间里信号是平稳的。根据文献[13]分析可知, 战场声目标信号在10~20 ms内是准平稳的。因此对采样率是11 k Hz的信号进行功率谱分析时, 选取的帧长度是1024点数据。

2 功率谱特征提取与维数简约

2.1 信号的频域分析

采用了Welch法对滤波后的声信号进行功率谱估计, 即对信号重叠分段、加窗函数以及FFT等算法计算信号序列的自功率谱 (P) , 其算法表达式为:

式 (1) 中, L为分段的数量;M为分段的长度;d (n) 为选择的窗函数。对五类目标的声音信号分别作Welch功率谱分析, 如图2 (a) ~图2 (e) 所示。

从图3 (a) ~图3 (e) 可以看出, 五类目标的频谱峰值之间都存在明显的谐波关系, 其特征信息正如上文分析, 主要集中在0~1 k Hz, 因此只需对0~1 k Hz频带上的信号进行功率谱特征提取。

2.2 信号的频域特征提取

对采样率11 k Hz, 数据点是1024的数据进行功率谱估计时, 其频率分辨率是10.7 Hz。因此频率域上选取前100个数据, 对应的频率范围为0~1.07 k Hz, 这样频段就包含了主要的信号特征。然后将这100个数据, 每两个求和, 形成50维的谐波集特征, 如图4 (a) ~图4 (e) 。

2.3 频域特征的降维处理

主成分分析 (principle component analysis, PCA) 是一种基于目标统计特性的最佳正交变换, 具有提取模式中最大描述特征的能力, 然而PCA是一种线性算法, 只考虑数据中的二阶统计特性, 当特征信号中存在着大量非线性关系时, 已经不能满足要求。而PCA与核函数的有机融合形成的KPCA不仅特别适合处理非线性问题, 而且能够提供更多的信息。

2.3.1 核主成分分析

核主成分分析 (KPCA) 是经典PCA的核版本[14], 其基本思想就是通过一个非线性映射, 将输入数据映射到一个高维特征空间, 再在特征空间上进行线性主成分分析。给定一个包含m个样本的样本集X, xi (i=1, 2, …, m) 是样本集X中第i个样本, 将样本xi向RKHS H做隐含映射

设xi (i=1, 2, …, n;0

对于λ≠0我们可以写成

合并式 (3) 和式 (5) , 可以看出这一问题等价于求Gram矩阵的特征分解

式 (6) 中, a=[a (1) , a (2) , …, a (n) ]T。Gram矩阵的元素为κ (i, j) =K (xi, xj) , K (., .) 采用核函数。这样在式 (6) 中, 对应于κ的第k个 (非零) 特征向量, R的第k个特征向量可以表示为:

式 (7) 中, λ1≥λ2≥…≥λp表示各自的以降序排列的特征值, λp是最小的非零特征值, akT≡[a (1) , a (2) , …, a (n) ]是Gram矩阵的第k个特征向量。后者被假设成规范化的, 这样〈vk, vk〉=1 (k=1, 2, …, p) , 其中〈·, ·〉在Hilbert空间H内的点积。这使得对ak等量归一化, 结果为

2.3.2 基于KPCA的降维处理

按2.2节所述, 试验得到的五类信号的50维谐波集特征作为输入样本。然后利用2.3.1节的KP-CA法从特征空间中抽取核主成分特征。具体步骤如下:

1) 计算Gram矩阵κ (i, j) =K (xi, xj) (i, j=1, 2, …, n) , 采用高斯核函数, 其表达式为

式 (9) 中, 参数σ=0.3N, N为原始输入空间的维数。

2) 计算κ的n个特征向量和对应的特征值ak、λk, 其中k=1, 2, …, n。

4) 归一化主投影特征向量υk (k=1, 2, …, m) 。

5) 计算在各自主特征向量上的m个投影

6) 将m个投影组成特征向量T'1=[y (1) , y (2) , …, y (m) ]。

五类目标用KPCA降维处理后的特征向量如图5 (a) ~图5 (e) 所示。本文φ (m) 取80%, 则m=10。

3 最优小波包能量特征提取

基于最佳小波包基的特征提取方法[16]的基本思想是根据战场目标声音信号的频率特性, 选择不同的位置或频率对信号进行小波包分解, 在保证子频带不重叠的前提下, 用不同的子带组合覆盖整个频带。因此, 对于一个声音信号, 希望选择用较好的小波包基来表达此信号的特征。基于最佳小波包基的特征提取流程图如图7所示

1) 由小波包滤波后的信号频带范围为0~1375 Hz, 第1层分解后得到小波包系数C10和C11, 结合1.1节五类目标声音信号的频率特点可知, 除了机动车在C11频段上包含较多信息外, 其他声音信号在此频段包含的信息非常少, 故无须对C11进行细分。

2) 对C10进行第2层分解, 得到C20和C21。

3) 对C20和C21进行第3层分解, 得到4组系数C30, C31, C32和C33。根据直升机、坦克、战斗机的基频特性, 得知C33所对应的频带包含这3种信号的信息相对较少, 故不再对C33节点进行分解;C33只有巡航导弹主要能量集中在C30, 其他目标在C30频段上包含的信息非常少, 故无须对C30进行细分。

4) 由于C31和C32所对应的频带对直升飞机、战斗机和坦克都包含能量较大的信息, 为了达到更好的分类效果, 对C31和C32进行第4层分解, 得到C42, C43, C44, C45四组系数。最终得到的最佳小波包分解树图如图8所示

对应的最佳小波包基的节点分别为 (3, 0) (4, 2) (4, 3) (4, 4) (4, 5) (3, 3) (1, 1) 即这6个节点覆盖了不同频率成分的整个信号带宽, 每个节点所覆盖的频率分布范围见表1。

完成了对整个频带的非均匀划分后, 从低频到高频连续提取各节点的系数, 则原信号x (t) 可在最佳小波包基下分解为不重叠的7个子带的小波包系数:

这7个小波包系数可以表征战场目标的声音信号在不同频带的信号特点, 本文采用最佳小波包系数的能量作为信号的特征, 组成特征向量, 即式 (16) 。

小波包系数Ci, j对应的能量为Ei, j, 则有:Ei, j=∫|Ci, j (t) |2dt。构造最佳小波包基德能量, 得到初始特征向量如下:

对初始特征向量T2进行归一化处理, 令

得到最终的归一化特征向量T'2

按照上述特征提取方法, 对五类目标声音信号经过最佳小波包分解后, 各频带能量归一化的直方图如图9 (a) ~图9 (e) 所示。

将本节的最优小波包能量特征向量T'2, 同2.3.2节计算的特征向量T'1组合, 形成最终的联合征向量T=[T'1, T'2], 通过支持向量机 (support vector machine) 进行分类识别。

4 实验结果及分析

取某战斗机、直升机、坦克、车辆、巡航导弹五类战场目标共500个样本, 其中训练样本和测试样本各250个。分别采用单一特征向量的功率谱特征向量、最优小波包能量特征向量同本文提出的联合特征向量进行分类对比, 识别结果分别见表3、表4和表5。表中识别率均为目标正确分类的识别率, 计算公式为:识别率=正确的目标分类数目/总的测试样本数目。

对比文献[12]中用小波包作为特征向量、SVM进行分类的结果和表3、表4可知, 本文提出的将特征向量引进KPCA降维处理后, 再用SVM进行分类的识别结果明显优于直接用特征向量在SVM中的分类结果。对比表5可以看出, 联合特征向量要比单一特征向量的识别精度高, 且对每一种目标的识别率都在95%以上。因此本文提出的战场声目标识别算法具有非常高的识别精度。在战场侦查中, 无线传感器网络将监测到的数据发送到簇头, 在簇头中利用本文提出识别算法, 能够更加准确地识别出监测区域的重要军事目标。

5 结论

从无线传感器的实际应用出发, 提出对战场声目标的分类识别方法, 首先对采集的声音信号用小波包去噪, 然后利用核主分量分析对提取的功率谱特征进行降维处理, 再将降维处理后的特征与最优小波包提取的能量特征组成联合特征向量, 最后利用支持向量机构成的多分类器进行模式识别。通过对五类目标的仿真实验, 结果表明, 本文提出的分类识别方法精度比直接利用特征向量在SVM中的识别精度高, 且联合特征向量的识别算法比单一类型特征的分类识别精度高出10%。这为无线传感器网络在军事中的应用提供重要的理论参考价值。

声目标识别 篇2

1. 探测用声呐及其成像的特点

水声图像与光学图像在本质上有着极大的相似性, 二者都属于能量的平面分布图, 但是二者也具有一定的差异, 这主要是因为二者的介质有着较大的差异。采用成像声呐技术, 一般中心频率都在几百千赫以上, 而海水介质对声波能量的吸收是与其中心频率的大小有着直接关系的, 并且频率增长后, 能量吸收是以平方次逐渐递增的, 在海水介质中, 声波的体积还会扩散, 这也使得声波在海水中有着较大的损失, 影响着图像声波的质量。水声成像的质量与声辐射情况有着较大的关系, 而且容易受到周围环境、噪声等外界因素的影响, 如果目标被遮挡, 会影响识别的准确性。声呐图像的识别技术与传统的光学图像技术相比, 准确度较低, 而且图像的质量会受到较多因素的影响, 这会影响目标的可识别率, 还会导致信息缺失等问题的产生。

本文对声呐图像技术进行了研究与分析, 下面笔者对这项技术的特点进行简单分析:首先, 水下图像声呐识别, 可能会受到水纹以及气泡的影响, 船体可能会被一些东西遮挡, 但是识别目标时, 形状特征还是较容易判断的。其次, 探测目标可能会出现与成像声呐一起运动的情况, 这会导致目标图像旋转以及平移发生变化。以P450E型前视声呐技术为例, 获取的一帧图像如图1所示。

图像声呐目标识别技术会受到海水介质的影响, 并且会发生声波能量被吸收的反应, 声呐图像容易出现噪声大、边缘模糊, 图像质量较差等问题。但是可以肯定的是, 图像的形状特征还是比较明显的。在识别的过程中, 可以采用轮廓提取的方式, 为了保证识别的准确性, 相关工作人员还可以采用边缘计算公式。通过多次试验发现, 采用边缘检测算法在改善声呐图像质量方面效果并不理想, 所以, 相关工作人员还会采用主动轮廓模式对图像中的目标进行识别。由于声呐成像技术具有随着目标图像一起旋转与平移的特点, 工作人员多会采用基于水平集和支持向量机的方式对目标进行识别, 收到的效果极佳。

2. 基于水平集和不变矩的声呐目标识别算法

基于水平集和不变矩的声呐目标识别算法流程如图2所示, 在具体识别的过程中, 首先是训练样本的轮廓, 得到一些轮廓特征;其次是利用高分辨率技术对实时获得的图像进行预处理, 从而提取出目标轮廓, 对目标进行计算;最后是将识别过程中所提取的特征值输入支持向量机中与需要识别的目标特征进行匹配, 如果匹配一致, 说明识别到的目标与设定目标一致。

基于支持向量机的目标识别需要利用支持向量机这一设备, 其可以有效地降低水下探测中出现误差或图像质量较差的概率。基于支持向量机的目标识别是根据有限样本信息在模型中找到最佳折中, 这项技术最大的特点是主要针对小样本进行目标识别, 可以根据现有信息达到全局最优解, 结合核函数运算公式, 可以避免出现维数灾难。这项技术应用的范围比较广, 可以解决目标图像识别中存在的问题, 从而提高识别的质量。

3. 声呐图像目标识别实验

采用P450E高分辨率图像声呐目标识别技术, 对水下船体识别进行算法验证, 这可以找到该项技术存在的问题, 从而制定出改进的方案。

3.1 实验过程

在本次验证中共有3个环节:第一, 样本训练支持向量机。根据声呐得到的图像, 从中选出30幅, 并且将含有船体的15幅作为正样本, 剩下15幅作为负样本, 这可以得到两个样本集。含有船体图像的正样本如图3所示, 其中前5幅是标准图像, 其他10幅都是在标准图像的基础上对目标进行旋转与位移。在后10幅图像中可能存在船体遮挡的问题, 比如中间5幅存在噪声遮挡问题, 最后5幅是被部分遮挡提取的轮廓图, 如图3所示。

第二, 图像的预处理。在读取声呐制成的视频图像时, 还要根据成像的特点对图像进行剪切、去噪, 这项工作主要是为了去除图像中存在的无用信息。采用缩小技术主要是为了提高运算速度。在声呐图像中会受到水文与气泡噪声的影响, 采用形态学滤波技术, 可以保留有用信息, 消除无用干扰信息。

第三, 提取目标轮廓。根据声呐成像的特点, 确定初始轮廓, 利用水平集法提取轮廓后, 在多个闭合中选取面积最大、受遮挡最少的图像作为船体轮廓。

第四, 支持向量机识别。将已提取的目标轮廓特征输入支持向量机中, 然后与目标进行匹配。这一过程一般会经过多次实验, 这是为了保证结果的准确性。在本文介绍的案例中, 核参数σ=23, 惩罚因子C=100.0。

3.2 实验结果

采用P450E型高分辨率前视声呐技术, 对视频图像进行反复实验后得出了以下实验结果。在选取的100帧图像中, 有52帧含有船体, 48帧不含船体, 发现当船体进入声呐视野范围后, 加入σ=0.01、0.04、0.09的高斯噪声后, 实验结果见表1。在选取的200帧测试图像中, 含有船体的有100帧, 不含船体的有100帧, 在对船体目标进行识别时, σ=0.01、0.04、0.09的高斯噪声识别实验中, 得到的结果见表1。

在两组实验中, 将不含船体的图像作为负样本, 发现如果船体进入水底地形、扫描范围存在岩石、鱼群等物质, 并且与船体的形状较为相似, 则识别的结果会出现较大的误差。本文为对声呐图像目标识别课题的初级阶段研究成果, 所涉及的图像多为学校港池附近淤泥海底地质的海域中获取的声呐扫描图。经实验验证, 本文算法主要适用于该类淤泥海底地质的海域中获取的声呐扫描图。在该类图像中由于水底地形、岩石和鱼群等造成的干扰较小, 将在下一步的研究中通过纹理特征值等方法对其他较复杂海底地形下扫描得到的声呐图像的识别进行进一步研究。

结语

通过本文的分析可以看出, 基于水平集和支持向量机的图像声呐目标识别技术是当前水下探测领域中比较先进的技术, 其可以保证识别图像的清晰性, 也可以提高识别率, 是科技不断进步的体现。采用高分辨率图像声呐技术, 在淤泥质海底环境中得到的扫描图识别率高达95%。随着海洋技术的不断发展, 相关技术人员还需要对这项新型目标识别技术进行改进与优化, 解决视频图像目标轮廓提取中存在的时间复杂度较大、迭代次数较多等问题。在不同的地质与地形下, 声呐扫描识别的准确性也是不一样的, 只有不断地改进技术, 才能拓宽应用的范围, 保证应用的质量与效果。

摘要:本文对基于水平集和支持向量机的图像声呐目标识别方法进行了介绍, 这是一种利用声呐技术获得图像, 并对目标进行识别的先进技术。水平集法可以根据声呐图像了解目标的大概轮廓, 根据不变矩, 找到特征矢量, 并结合支持向量机, 得到识别结果。这种方法有着较高的识别率, 应用的范围也比较广, 笔者根据自身经验对这种方法的应用情况进行了介绍, 希望对相关工作人员提供一定参考意见。

关键词:水平集,支持向量机,图像,声呐,识别

参考文献

[1]李锋, 汤宝平, 董绍江.基于正交邻域保持嵌入特征约简的故障诊断模型[J].仪器仪表学报, 2011 (3) :621-627.

声目标识别 篇3

混凝土作为应用最为广泛的工程材料,在建筑、道路、桥梁、大坝等工程结构中起着非常重要的作用。其中,桥梁多为钢筋混凝土结构,在恶劣的应用环境中,结构很容易产生细微裂纹等缺陷,如果不及时发现并处理,微裂纹继续发展有可能导致桥梁结构的损坏,严重情况下将造成桥梁断裂破坏,带来巨大的人员伤亡与财产损失[1~2]。因此,对桥梁结构早期微裂纹的有效检测,消除故障隐患,对保证桥梁的安全使用影响巨大。

目前,对钢筋混凝土结构缺陷检测的方法主要有超声法、红外热像法以及声发射法等[3]。其中,声发射(Acoustic Emission,简称AE)能够利用材料局部能量变化释放的瞬态弹性波来准确检测和定位故障缺陷,灵敏度非常高,可以达到微米数量级[4],加之声发射具有动态连续检测功能,从而在在诸多领域得到了广泛的研究与应用。因此,将声发射技术应用到桥梁钢筋混凝土结构缺陷的在线实时监测中,是一种可靠的途径,并得到了专家学者们的重视。纪洪广等通过三点弯曲试验分析混凝土断裂过程中声发射关联分维数的变化规律,确定了混凝土试块在临界断裂时的分型特征识别模式,并证明此识别模式可以作为材料临界断裂的判别特征[5~6]。陈兵等通过三点弯曲试验将钢纤维混凝土梁的声发射信号振幅分布特性划分为不同的区段,并与混凝土内部不同的破坏机制建立一一对应的联系[7~8]。骆英等则通过三点弯曲载荷试验对不同强度的混凝土试块以及同强度的素混凝土和钢筋混凝土试块进行研究,发现全波形声发射技术可以实现混凝土结构的损伤在线监测[1,3]。在他们的研究基础上,本文进一步考虑了声发射信号中微弱故障特征信号的提取与识别技术,提出了基于非线性盲源分离消噪的钢筋混凝土梁全波形声发射信号时频检测方法。该方法的创新点在于:利用非线性独立分量分析(Nonlinear ICA)从多个传感器信号中分离出故障源,消除外界噪声干扰,同时,利用维格纳分布(WVD)对故障源信号进行时频分解,提取敏感故障时频特征,从而提高梁损伤检测精度。最后,利用三点弯曲载荷试验验证所提检测方法的有效性。

1 非线性盲源分离

传感器在采集声发射信号时,难免会受到通信环境的影响而引入非线性噪声信号。由此,会干扰故障特征提取过程,严重时会使故障辨识结果错误。因此,独立分量分析(ICA)被应用到多通道传感器信号的去噪中来,即在对信号系统没有任何先验知识的情况下,对含有噪声的原始信号进行分离,学术上称为盲源分离。然而,传统的ICA是建立在线性假设基础上的[9],当信号系统属于线性系统时,源信号分离的效果比较理想。但是现实系统一般为非线性系统,源信号与噪声属于非线性混合,所以基于线性假设的ICA很难分离出真实有效的源信号。近年来,基于神经网络的非线性独立成分分析引起了学术界的高度重视,与传统的线性ICA算法相比,非线性独立成分分析能利用神经网络强大的非线性函数逼近能力实现对非线性混合的分离。基于神经网络的非线性独立成分分析数学方程为[10]:

式中,s=[s1s2…sn]T是n个源信号,x=[x1x2…xm]T是m个传感器采集到的源信号的混合观测信号,A为线性混合矩阵,t=[t1t2…tl]T为非线性混合后的观测信号,f(x)为非线性混合函数,z=[z1z2…zm]T为非线性解混后的观测信号,g(t)为非线性解混函数,y=[y1y2…yn]T为分离后的源信号,W为分离矩阵。从式(1)的数学表达可见,盲源分离是对源信号的估算,其核心是找到非线性混合函数f(x)的反函数g(t)以及线性混合矩阵A的逆矩阵W。但是f(x)和A都是未知的,不能直接求得g(t)和W,为了能够得到近似逼近f(x)和A的逆,本文采用径向基函数(RBF)模型,结合最大互信息准则来求解解混函数和分离矩阵。其计算流程如图1所示,具体的理论推导可参见文献[11]。

在声发射信号采集过程中,噪声和弹性波之间具有相互独立性,通过基于神经网络的非线性盲源分离算法可以得到相互独立的分量,去除独立的噪声数据,从而保证了材料损伤特征信息不被破坏。这样,就可以利用WVD提取到可靠的故障特征,便于故障的早期识别。

2 试验与数据分析

试验用钢筋混凝土梁截面尺寸:180mm×120mm,长度1200mm,混凝土强度等级C50,梁底纵向构造钢筋为A5覫12,钢筋保护层厚度30mm。混凝土的配合比为水泥:砂:石子:水=1:1.32:2.32:0.40,采用人工搅拌混凝土。三点弯曲试验采用万能疲劳试验机加载,利用PXWAE鹏翔全波形声发射仪采集声信号,8个中心频率为150k Hz的压电传感器布置在试件正反两侧面,图2为一侧4个传感器的布置。在加载前,梁试件已经存在微裂纹,加载过程中,原始裂纹扩张已经与新裂纹合并形成宏观裂纹,随着进一步加载,宏观裂纹扩展断裂。

图3所示为声发射积累能量随加载载荷关系曲线。从图中可见,裂纹的高速扩展期处于BC段与DE段,在FG段断裂,破坏载荷为61k N。试验结果与文献[1]吻合。

通过分析图3,可以认为AB段是安全区,裂纹处于早期状态;DE段是危险段,宏观裂纹已经出现;FG段则是破坏段。这几个阶段对应混凝土梁失效的典型过程,因此,本文以AB、DE和FG三个时间区段的声信号作为研究对象,利用非线性盲分离和WVD时频分析技术提取各个阶段的损伤本质特征值作为对混凝土梁状态的评估依据,结合支持向量机来实现梁损伤检测的智能识别。

图4~图9给出了早期裂纹、宏观裂纹与断裂三种状态下声发射信号的WVD时频谱,并对比了传感器采集原始信号与非线性ICA分离信号的时频特性。

从图4~图6可见,传感器采集到的初始信号波峰主要集中在50~200k Hz,最大能量集中在75k Hz左右;另外,大于200k Hz的高频区也出现了能量波峰。而从理论分析与已经得到的研究结果[1,3,4,5]可知,正常钢筋混凝土梁的声发射信号能量峰值一般在10~100k Hz,最大能量集中在10k Hz左右,宏观裂纹以及断裂时能量峰值则在10~165k Hz。对比图4~图6分析可知,受到环境因素以及传感器自身的影响,噪声污染使得梁声发射信号的频率有了一定的漂移,并且高频率区域出现了噪声的能量波峰。而从图7~图9可见,经过非线性ICA去噪后,正常钢筋混凝土梁的声发射信号能量峰值主要集中在10~100 k Hz,最大能量集中在10k Hz左右,而宏观裂纹以及断裂时能量峰值则在10~165k Hz,整个破坏过程的频谱由低频到高频发展,分析结果与文献[1]吻合。由此可见,通过非线性ICA处理,传感器原始信号中的噪声干扰被有效地抑制与消除,去噪后的信号更加接近理论值。同时,注意到图7~图9中不同裂纹状态下频率区间[0~20k Hz]、[40~60k Hz]、[80~100k Hz]、[130~150k Hz]以及[160~180k Hz]的能量分布存在较大不同,所以,可以沿着时间轴方向将此5个区域的能量值作为识别梁裂纹状态的重要特征。

鉴于支持向量机(SVM)具有较强的模式识别能力[12],本文将计算得到的5个区域能量值作为SVM的输入变量,其输出为[0 0 1]、[0 1 0]和[1 0 0]分别对应梁裂纹的三种不同状态,从而来判断梁的裂纹情况。实验中,对梁的微裂纹、宏观裂纹和断裂声发射信号分别取50个样本来训练SVM,然后用训练好的SVM去判定新的输入样本。表1为SVM对新样本的识别结果,其中,分别采用了非线性ICA-SVM、线性ICA-SVM和只使用SVM的测试结果。从表中可见,使用ICA去噪后可以明显提高裂纹状态辨识精度;同时,非线性ICA比线性ICA的去噪效果好,裂纹状态辨识更准确。因此,本文所提出的短时交通流量预测方法具有较高的预测能力,有效提高了短时交通流量预测精度。

3 结论

(1)随着混凝土梁裂纹的扩展,其声发射信号频谱峰值范围相应扩大,但是在主要的特征频率50k Hz与100k Hz左右的能量集中具体不同特点,可以作为识别梁裂纹发展状态的重要特征。

(2)传感器采集到的声信号难免被噪声污染,影响信号的时频分布特性,采用非线性ICA可以较好去除噪声干扰,恢复信号本质特性,达到提高梁损伤识别精度的目的。

摘要:钢筋混凝土桥梁暴露在恶劣工作环境下常常受到裂纹损伤威胁,及时有效地检测到混泥土梁的微裂纹以及识别梁的损伤状况是保证桥梁安全作业的重要基础。针对目前采用全波形声发射仪采集声信号受到噪声污染而影响探伤精度的问题,提出了基于神经网络的非线性独立分量分析(ICA)与维格纳分布(WVD)的损伤声发射信号特征提取与识别的新方法。通过RBF网络估计混入声信号中的非线性噪声成分,利用ICA算法分离出真实的梁损伤声信号,消除噪声干扰,并应用WVD分析分离信号的时频谱分布,提取信号特征频率处的能量特征作为识别损伤状态的有效参数。三点弯曲加载试验结果表明,非线性ICA能够有效抑制噪声导致的声信号频率漂移,得到信号可靠的关键特征,提高梁裂纹损伤的识别精度,且结果比不进行去噪处理提高了9%。

关键词:钢筋混凝土,无损探伤,声发射,非线性独立分量分析,谱分析

参考文献

[1]王彬,顾建祖,骆英,李忠芳.预应力钢筋混凝土梁破坏过程的声发射特性实验研究[J].防灾减灾工程学报.2006,26(4):453-457.

[2]杨智春,于哲峰.结构健康监测中的损伤检测技术研究进展[J].力学进展,2004,34(2):215-223.

[3]王余刚,骆英,柳祖亭.全波形声发射技术用于混凝土材料损伤监测研究[J].岩石力学与工程学报,2005,4(5):803-807.

[4]Ohtsu M.Acoustic emission characteristics in concrete anddiagnostic applications[J].Journal of Acoustic Emission,1987,6(2)99-108.

[5]纪洪广,张天森,蔡美峰,张志勇.混凝土材料损伤的声发射动态检测试验研究[J].岩石力学与工程学报,2000,19(2):165-168.

[6]纪洪广,王基才,单晓云,蔡美峰.混凝土材料声发射过程分形特征及其再断裂分析中的应用[J].岩石力学与工程学报.2001,20(6):801-804.

[7]陈兵,张东,吴科如.混凝土梁声发射特性试验研究[J].建筑材料学报,1998,1(4):315-319.

[8]陈兵,姚武,张东,吴科如.混凝土梁破坏机制的声发射特性试验研究[J].建筑材料学报,2001,4(4):332-338.

[9]Hyvarinen A.,Karhunen J.,Oja E.In dependent componentanalysis[M].John Wiley&Sons,New York,2001.

[10]张天瑜.基于神经网络的变速率非线性盲源分离ICA算法研究[J].陕西科技大学学报,2010,28(5):105-109.

[11]Y.Tan,J.Wang,J.M.Zurada.Nonlinear Blind SourceSeparation Using a Radial Basis Function Network[J].IEEETrans.On Neural Networks,2001,1(1):124-134.

声目标识别 篇4

1 SAW RFID系统组成

SAW RFID具有无线无源、识别距离远、识别速度快、批量生产成本低、对液体和金属不敏感的优点,可以用来测量压力、应力、扭曲、加速度以及温度等参数的变化,应用广泛。

一个完整的声表面射频识别系统[2]至少包括收发机、SAW标签以及天线三部分,如图1所示。其中,SAW标签由叉指换能器(IDT)和刻在标签上的反射栅组成。识别时,读卡器的天线周期性地发送高频询问脉冲在电子标签天线的接收范围内,并在晶体表面传播。根据声表面波的物理特性,接收到的信号经过压电效应和逆压电效应进行声电以及电声的转化,实现标签信号的发送和接收,收发机通过天线传输电信号。

2 零中频SAW RFID收发机设计

零中频(Zero-IF)[3]又称为直接下变频(Direct-Conversion)解,其方法是将信号从载波直接变频到基带。这时中频为零,镜频和自身信号重叠在一起,要采用I/Q正交的结构抑制镜像频率干扰。由于零中频接收机不需要片外高Q值带通滤波器,所以可以实现单片集成而受到广泛的重视。

零中频接收机最大的优势是:下变频过程中不需经过中频,且镜像频率(即射频信号本身)不存在镜像频率干扰,原超外差结构中的镜像抑制滤波器及中频滤波器均可省略。这样一方面取消了外部元件,有利于系统的单片集成,降低了成本;另一方面系统所需的电路模块及外部节点数减少,降低了接收机所需的功耗,并减少了射频信号受外部干扰的机会。

零中频结构的优点是:(1)零中频方案利用直接解调方案,不存在中频频率,因此没有镜像干扰。(2)接收机的射频部分只包含了射频放大器以及混频器,易于满足线性动态范围的要求。(3)电路设计简单,容易集成,成本较低,PCB布板覆盖面积小。

2.1 发射机电路设计

本文设计的发射电路[4]如图2所示。其中,混频器采用LT5519的上变频混频器,其RF输出频率带宽为0.7 GHz~1.4 GHz,IF输入频率带宽为1 MHz~400 MHz;本振采用ADF4360-7频率综合器,输出频率为350 MHz~1 800 MHz;π型衰减器由3个滑动变阻器组成,R1=17.6Ω,R2=R3=292.4Ω,其衰减为3 dB;带通滤波器采用B3588的声表面滤波器,其中心频率为915 MHz,带宽为26 MHz,插入衰减为2.9 dB;功率放大器采用MA02014,其输出功率为30.8 dBm,功率增益为30.8 dB。

2.2 接收机电路设计

本系统的接收机采用零中频的结构进行设计。零中频接收机由于没有中频带通滤波器的影响,在应用中也比超外差收发信机更灵活。不过零中频结构存在直流偏置、本振泄漏、偶次失真和闪烁噪声[3]等问题。针对这些问题,本文的解决方案如下。

(1)直流偏置是零中频方案特有的一种干扰,本文采用交流耦合以及谐波混频来解决,具体设计如图3所示。

(2)本振泄露是指混频器中泄露到输出口或输入口的本振信号。本文按照GB7236选择高隔离度的混频器以及采用本振泄漏消除电路对本振泄漏预校正参数进行修正。

(3)在电路设计中,可以采用提高混频器和锁相环的隔离度或在低噪声放大器和混频器中间使用全差分结构来抑制偶次谐波,进而消除偶次失真。

(4)将零中频结构中的混频器设计成有一定增益,并且尽量减小混频器的噪声来降低闪烁噪声。

此外,由于器件的性能和品质都直接影响接收机接收信号的质量,所以在电路设计过程中,选取高性能、低损耗的器件,以减少干扰噪声。

根据以上解决方法,本文给出如图3所示的零中频接收机的设计方案。图3中前端包括带通滤波器(BPF)和低噪声放大器(LNA),其中带通滤波器在常温下射频输出功率最大可达到12.6 W,插入损耗比较低(为1.2 dB),并且损耗变化幅度为±0.25 dB,性能良好。低噪声放大器具有低噪声、高增益、广泛的动态范围等优点,在900 MHz频段其增益可达到17 dB、低噪声系数不超过1.0 dB。

此外,该接收机采用I、Q零中频正交解调结构[5],来自于天线的标签反射信号经功分器分成两路,分别送入相应的混频器与相差90°相位的两路本振信号混频得到I、Q两路基带信号。该微弱信号随后经过低噪声放大器和低通滤波器放大滤波后,经A/D采样送入基带处理器进行解码处理。设计中同时利用了自动增益控制(AGC)平衡和匹配的作用来防止直流漂移受增益变化的影响而产生干扰,以增加系统的可靠性。

2.3 控制单元设计

控制单元的硬件系统由前端模块、DSP处理模块、显示模块、系统功能模块和电源模块组成,如图4所示。

DSP是整个系统的核心模块,其采用的是TI公司的TMS320DM6437芯片[6],主要作用是实现数据的实时处理。其数据的传输通过前端模块实现,主要是通过收发机进行实时采集。功能模块是实现用户需求的模块,其主要功能包括语音输入/输出、SD卡的读写、USB的传输以及温度的测量等。电源模块主要用于保障整个系统电源的稳定。

3 测试结果与性能分析

为了验证所设计的接收机传输性能的质量,本文通过频谱分析仪分别对发送信号和接收信号进行了测量,并给出测试结果分析。

如图5所示,以915 MHz脉冲信号为例,利用Agilent E4407B频谱分析仪[7]对发送信号进行频谱分析,可以得到高质量的915 MHz的脉冲信号,信号强度高达13.36 dBm,而干扰噪声近似为0。

利用信号源产生915 MHz信号,该信号经过零中频接收机,经射频前端处理、正交解调、放大滤波之后送给A/D芯片进行采样。如图6所示,采样频率为40 MHz,采样输入信号为20 kHz,此时信噪比可以达到70 dB以上,满足接收机要求。

本文采用了I、Q零中频正交解调技术,结合SAW的物理特性,针对零中频结构中的直流偏置、偶次失真等问题,设计了一种SAW RFID收发机,并以SAW RFID系统结构为基础,分别给出了发射机和接收机的设计框图,同时描述了各射频模块的输出功率、损耗、增益等参数性能,减少收发机的误码率和噪声干扰。研究表明,该系统体积小、成本低、电路简单,发射915 MHz信号时功率高达13.36 dBm,同时接收机信噪比可以达到70 dB,干扰小,达到了系统设计要求。

参考文献

[1]陈焱舒.应用于GSM零中频接收机的基频电路设计[D].西安:西安电子科技大学,2009.

[2]王圣礼.超高频射频识别(RFID)阅读器的设计与实现[D].杭州:浙江大学,2008.

[3]李志群,王志功.零中频射频接收机技术[J].电子产品世界,2004(13):69-72.

[4]LUDWIG R,BRETCHK0P.射频电路设计——理论与应用[M].王子仪,译.北京:电子工业出版社,2002.

[5]徐建,吴建辉,时龙兴,等.双正交零中频接收机拓扑结构设计[J].电路与系统学报,2000,5(2):78-81.

[6]Texas Instruments Incorporated.TMS320DM6437 video/imag-ing fixedpoint digital signal processor[R].2010.

声目标识别 篇5

目前对LY12铝合金在拉伸状态下的声发射特征检测相对较少,因此检测LY12铝合金材料的多种拉伸状态下的声发射特性是十分必要的[6,7]。在此,笔者利用声发射技术研究了LY12铝合金试件在弹性、屈服、塑性变形和断裂阶段的声发射信号特征,以期获得试件状态与声发射信号特征之间的关系,为LY12铝合金材料部件的定损提供实验依据。

1 试验材料①

本次试验中所使用的材料为LY12高强度铝合金,其化学成分为:硅(0.50%)、铜(3.80%~4.90%)、铁(0.50%)、锰(0.30%~0.90%)、镁(1.20%~1.80%)、铬(0.10%)、镍(0.50%)、锌(0.25%)、钛(0.15%)、其他(0.15%),其余为铝。先采用机械加工计数制备试件,如图1所示,试件结构尺寸420mm×50mm×2mm,无裂纹无损伤。

2 试验装置

试件拉伸采用WEW-100万能试验机,声发射检测装置采用美国物理声学公司的PCI-2型声发射检测系统,传感器选用谐振式传感器,其工作频率150k Hz。构建的拉伸试验系统如图2所示,传感器布置于试件试验区的两端,传感器的前置放大器增益为40d B,门槛值30d B,采样频率2MHz,峰值限定时间200ms,声发射击波限定时间600ms,声发射击波闭锁时间800ms。

3 试验及结果分析

3.1 持续拉伸试验

持续拉伸试验的拉伸速度设为150N/s,试验持续历时1 287s,试件材料最大可承受应力24k N,整个拉伸过程分为3个阶段。试件拉伸和声发射事件特征如图3所示。

材料的弹性变形阶段为0~150s,弹性变形的实质是材料在外力作用下产生变形,当外力取消后,材料变形即可消失并能完全恢复原来的形状。从声发射事件积累计数曲线(图3)可以看出,声发射事件计数只有一个突发的计数积累,之后并没有增加。由此表明,在材料的弹性变形阶段,材料不产生或产生少量的声发射信号。

材料的屈服阶段在150~200s之间,通过图3中的拉伸应力曲线可以看出,试件并没有明显的屈服阶段,通常规定以卸载后产生0.2%的塑性变形的应力为屈服应力。经试验测试,试件的屈服应力约18k N。试验设定材料屈服应力范围内的时间段为屈服阶段。在此阶段内,事件计数相比前一阶段有明显的增加,这说明在材料的屈服应力段,开始有大量声发射信号产生。

材料的塑性变形阶段是从200s至断裂结束。塑性变形指材料内部出现大量的位错,使材料发生永久性的变形,并且在此阶段后期,材料会出现裂纹,裂纹经历成核、扩展直至断裂。在试验中,材料的塑性变形阶段出现锯齿流变现象。从图3的事件累积计数曲线可以看出,塑性变形阶段的前期事件计数有较大幅度的增加。而在900s至试件断裂的时间段内,事件计数增长相对前半段较为平缓。因而,从声发射事件计数的增长变化可以很明显地反映材料在拉伸过程中的状态变化,特别地可用于区分弹性变形阶段和塑性变形阶段。

将事件计数与声发射信号的平均幅值变化结合,可以更为明显地反映声发射在材料拉伸过程的阶段特性。图4为声发射信号平均幅值图,弹性变形阶段(0~150s)只在前期有一段相对较高幅值的信号产生,随后平均幅值就开始减小,前期的高幅值信号主要是试验机夹具产生的摩擦噪声,随后的数量较少;幅值较低的信号为材料内部小部分缺陷产生的声发射信号。在屈服阶段(150~200s),平均幅值有所提高,当材料进入塑性变形阶段,即200s之后,声发射信号平均幅值相比前两个时间段内的信号平均幅值提高较为明显,有的甚至达到60d B以上,这主要是由于材料发生塑性变形,材料内部出现大量位错,从而产生了大量的声发射信号[8]。在900s至试验结束的时间段内,声发射信号的平均幅值较之前有所降低,但是幅值变化较为稳定。这一过程的声发射信号主要是由裂纹萌发和扩展产生的。

总之,上述两个主要的声发射特征参数已经可以很明显地区分试件所处拉伸过程的各个阶段。证实声发射技术完全可以动态地检测材料内部产生的变化。

3.2 保压试验

由持续拉伸试验可以看出,试件在24k N断裂,为了分析保压工况下的声发射信号特征,设定在拉伸应力达到10、20k N时分别进行2min的保压,保压试验应力与声发射事件计数如图5所示。

对比持续拉伸试验,图5所示的应力在10k N时正处于材料的弹性变形阶段。当进行保压之时,声发射事件计数并未增加。保压2min后,继续加载,当加载到屈服应力以前,声发射事件计数只有少量增加。应力加载至材料的屈服阶段(400~450s)时,声发射事件计数才有相对明显的增加,这与持续拉伸试验的声发射事件计数特征相符,说明在材料弹性变形阶段进行保压并不会有声发射信号产生,声发射事件计数在此阶段的特性也并未受到影响。

试验材料在20k N保压时,材料处于塑性变形阶段。在保压之前,即500s之前,声发射事件计数增加迅速。当进行保压时,声发射事件计数并未增加。保压2min后,继续对材料加载,直至断裂,其声发射事件计数曲线与持续拉伸试验相应阶段的事件计数变化基本一致,说明在塑性变形阶段,对试验材料进行保压也不会产生声发射信号,同时保压并不会对后续加载试验的声发射事件特性产生影响[9]。

从上述试验可以看出,无论材料处于何种拉伸变形阶段,对其进行保压,都不会产生声发射信号,同时也不会影响其后续声发射信号的产生。当试件受持续恒负载时,根据声发射的特征参数可以判定其状态也不会发生变化。

3.3 重复加载试验

在材料或构件的实际应用中,重复加载是常见工况。重复加载试验操作过程为:拉伸应力在11、16、20k N时保压2min,保压后,卸载应力分别至6、6、3k N进行保压,然后继续加载。同时对重复加载过程中的声发射信号特征参数进行研究。重复加载试验应力和声发射事件计数如图6所示。

在11k N进行重复加载时,材料正处于弹性变形阶段。在图6中,进行保压和卸载时,声发射事件计数没有明显的变化。当从6k N进行加载后,约450s时,声发射计数并未明显增加。从450s继续加载,材料进入屈服阶段,声发射事件计数有明显的增加,变化规律也与持续拉伸试验吻合。在16k N进行重复加载时,材料处于屈服阶段。从500s时刻起至800s,声发射事件计数并未增加。自800s起,声发射时间计数才有明显的增加,并且增加规律与持续拉伸试验此阶段的规律相符。拉伸应力达到20k N时,材料发生塑性变形。对材料进行重复加载,由事件累积计数曲线可以看出,从1 100s至重复加载到相应应力前,声发射事件计数并未增加,并且曲线后面的变化规律与持续拉伸试验一致。

在重复加载过程中,声发射事件计数与拉伸应力存在明显的对应关系(图7),在3次重复加载试验中,材料在重复载荷到达之前,所加载的最大应力之前并不会产生声发射信号。当重新加载至超过卸载之前的最大应力时,材料会继续产生声发射信号,声发射特征符合对比的持续拉伸试验各个阶段的声发射特征。因此,对无裂纹和损伤的材料进行重复加载过程时,无论材料处于何种变形阶段,在重复载荷到达之前所加载最大载荷之前不会发生明显声发射,并且重复加载并不会影响后续拉伸过程声发射信号的产生。

4结束语

声目标识别 篇6

声发射(Acoustic Emission,AE)是材料受外力或内力作用产生变形或断裂时,以弹性波的形式释放出应变能的现象[1]。目前声发射技术作为一种成熟的无损检测方法,已被广泛应用于石油化工工业、电力工业、材料试验等多个领域,但对胶合板的损伤监测,AE技术鲜有报道。

胶合板(也称夹板)是按相邻层木纹方向互相垂直的单板,经组坯胶合而成的板材,在我国已广泛应用于家具工业和建筑工业。胶合板的损伤模式主要包括基体开裂、纤维断裂、脱胶、分层等,每一种损伤都对应特定的声发射信号。然而,不同的损伤模式通常以组合形式出现,类别特征相互重叠[2],同时由于传播介质的各向异性和多源性噪声的污染,加大了AE信号鉴别的难度。因此,提取各声源信号特征与识别其损伤模式是声发射应用的首要任务和核心技术。

由于小波分析同时具有时域和频域表征信号局部特征的能力,所以特别适合分析瞬态特性的声发射信号。文献[3]用小波变换的方法分析了薄板中的弹性波,指出在波的传播过程中,多模式和频散的特性、模式的分离有助于准确提取信号中的信息。文献[4]用Daubechies离散小波进行了多尺度分解,利用频率能量分析玻璃纤维增强复合材料的不同损伤模式。通过区分能量的大小和不同能量所处的频率范围揭示了材料的破损模式。同时,近年来的研究发现,人工神经网络可对数据量多、特征复杂的信号提供准确度较高的自动分类能力。因此,本文结合小波分析和人工神经网络技术对胶合板不同损失声发射信号进行特征提取和模式识别。

1 小波包能量特征提取算法

1.1 小波包定义[5]

给定正交尺度函数ϕ(t)和小波函数ϕ(t),其中:

ϕ(t)=2kΖhkϕ(2t-k)(1)φ(t)=2kΖgkφ(2t-k)(2)

式中:hk,gk是多分辨分析中滤波器系数,且gk=(-1)kh1-k。定义下列的递推关系:

u2n(t)=2kΖhkun(2t-k)(3)u2n+1(t)=2kΖgkun(2t-k)(4)

n=0时,u0(t)=ϕ(t),u1(t)=φ(t)。以上定义的序列{un(t)}n∈Z为由基函数u0(t)=ϕ(t)所确定的正交小波包。

1.2 基于小波包分解的能量特征提取算法

小波包分解是在多分辨率基础上构成的一种更精细的正交分解方法。它根据被分析信号本身的特点,自适应地选择频带,确定信号在不同频段的分辨率。分解得到的各个频段分量既包含了信号的局部特征,也包含了不同的时间尺度信息,从而精确地给出信号能量随频率和时间的联合分布情况,即各频带能量的变化表征了各种信源的特征。因此,本文提取各尺度下各频段分量的能量占比作为各信号特征向量来识别声源类型。基于小波包分解的能量特征提取步骤如下:

(1) 对原始信号进行k层小波包分解,分别选择第k层从低频到高频包含主要信息的前n(n≤2k)个频段分量的信号特征;

(2) 对小波包分解系数重构(重构信号设为Ski),提取各频段范围的信号;

(3) 求各频带信号的总能量Eki:

Eki=|Ski(t)|2dt=j=1m|sij|2(5)

式中:sij(i=0,1,2,…,n-1;j=1,2,…,m)表示重构信号Ski中离散点的幅值;

(4) 以能量占比为元素构造一个特征向量:

Τ=[Ek0EEk1EEkn-1E]

该向量表征了信号的特征。其中:

E=(i=0n-1|Eki|2)12(6)

2 人工神经网络模式识别方法

2.1 神经网络的选择

人工神经网络是一个高度非线性的自适应并行分布处理信息系统,其信息处理由神经元之间的相互作用来实现。信息的存贮表现为神经元之间的物理联系。网络的学习取决于神经元连接权系的动态演化过程。神经网络的类型多种多样,但与模式识别的结合最成功的是多层前馈网络,也就是通常简称的BP(Back-propagation Network)网络[6],本文即选其进行模式识别。

2.2 BP网络结构的设计

由BP定理可知, 一个带S型激活函数的三层BP网络,只要隐节点数足够多,能以任意精度逼近有界区域上的任意连续函数,即一个三层的BP网络就能完成任意的n维到m维的映射。BP神经网络最重要的是隐含层的确定。虽然隐层神经元数目的选择不存在一个理想的解析式,但隐单元数目与问题的要求、输入/输出单元的数目都有着直接关系。综合现有文献,隐含层元个数的计算公式为:

n1=n+m+a(7)

式中:n1为隐单元数;m为输出神经元数;n为输入单元数;a是[0,10]之间的常数。

输入层节点数一般由一组特征值样本的数据量决定。在分类网络中输出层节点数可取类别数x或log x。本文隐含层采用双曲正切S型激活函数,输出层采用对数S型激活函数。

2.3 训练函数的选择

采用不同的训练函数对网络的性能可能会有影响,比如收敛速度等。本文应用各种典型训练函数对网络进行训练,观察各种训练算法的收敛速度和误差,最后确定Levenberg-Marquardt算法为本识别的最优训练函数。

3 实验和分析

3.1 实验方法[7]

试验对普通胶合板的胶合强度进行测试研究。样品选用德华装饰有限公司的“兔宝宝”牌5层胶合板,其内部为杂木夹芯,外覆桃花芯面板,由环保脲醛胶粘合而成。试样(如图1所示)按GB9846.9定义的普通胶合板力学性能测试试件方法锯制,尺寸为250 mm×25 mm×5 mm。试验测试温度为25 ℃,样品为气干状态。加载系统为深圳新三思有限公司SANS-CMT6104台式万能试验机;采集系统选用美国PAC公司PCI-2声发射采集系统,用两个宽带传感器S9208组成线定位阵列方式,同时采集各个波击的波形。

试验中为保证传感器与材料表面良好耦合,选用真空润滑脂作为耦合剂,传感器采用透明胶带固定在试样的表面。试样两端夹紧于试验机的一对活动夹具中,使其成一直线,试样中心通过活动夹具的轴线,拉伸沿试样长度方向进行,等速加荷,速度为3 mm/min,最大破坏荷重的读数精确到5 N,拉伸过程在准静态条件下进行,直到试样断裂为止。拉伸模型如图2所示。

3.2 胶合板加载声发射信号特征分析

对于厚度方向尺寸远小于其他两个方向的板而言,相应于一定的激励条件,在其中主要形成的是板波(Lamb波)。由文献[8,9]可知,受激励后,板中存在多种模式的板波,但当板厚远小于波长时,主要以两种模式的波为主,即最低阶的对称波S0和最低阶的反对称波A0。前者即是膨胀波,其传播速度是一个定值,没有频散效应;后者亦称弯曲波,它的传播速度与角频率的平方根成正比,有频散效应。一般情况下,板中的波是这两种波的组合,这两种波位移的相对幅度同激励方式有关。研究发现[8],当激励力源作用方向与板平面垂直时,在板中主要产生的是弯曲波。相反,当力源作用方向沿板方向时,产生的主要是膨胀波。一般而言,膨胀波的高频成分要比弯曲波丰富。胶合板受载形变作为强声发射源,其声源有基体开裂、纤维断裂、脱胶、分层等。理想上,纤维断裂总在平面内完成,其类似于一个沿板平面方向的力源,因此,激发的声发射信号应以膨胀波为主,无频散效应;而分层损伤则明显沿板厚方向发生,类似于一个沿板平面垂直方向的力源,因此,所激发的声信号波形当以弯曲波为主,存在频散效应;基体开裂、脱胶产生的声发射信号,其特征介于两者之间,一般应同时表现为膨胀波和弯曲波两种组合形式。

3.3 实验结果分析

本文选用db3小波[10,11,12]对采集的声发射信号做5层小波包分解,并进行第五层系数重构,计算各叶子能量占比,绘制时频、小波包谱和频谱图,比较各典型信号的特征差异。由实验结果得知,声发射源主要集中在主损伤区或断裂部位。考虑到声源的位置、材料物理特性及波的传播对类别特征的复杂影响[2],将所有样本取自主损伤区宽20 mm范围内的事件。对比四种典型的声发射源波形、频谱和小波包谱图,筛选出四类样本数据集,并应用小波阈值法消噪,得到各类别信号的典型波形如图3~图6所示。观察图3~图6中信号的傅立叶频谱发现,胶合板破坏损伤多以低于300 kHz以下的频率信号为主,且难以区分其特征差别。为获取各损伤信号的特征,必须结合小波包时频和小波包谱图分析。

基体开裂如图3所示,波形以低幅度较宽脉冲为主,频段较宽,膨胀波和弯曲波模式并举。FFT主峰频率位于40~180 kHz,小波时频图特征峰约集中在100 kHz以下和200 kHz处,发生的时间约在0.5~1.2 ms之间。小波包谱峰位于第一至第四和第七频段内,其中第一、第二频段的能量接近,总和约占总能量的60%,剩余40%几乎集中于第三、四、七段。

图4为五层胶合板纤维断裂图,由图中得出的信号主要以高幅度较宽脉冲形式出现,频率较低且单一,无频散现象。纤维断裂的FFT峰值主要集中在22~40 kHz,时频图特征峰位于40 kHz处,持续时间约为1 ms,小波谱峰值主要位于第二频段,能量占到总能量的70%以上,第一、四频段能量约占20%。结合样品断口纹理分析,断裂主要沿垂直于纤维方向扩展,呈剪切断裂方式,波形以膨胀波为主导,基本与第3.2节的信号分析一致。

五层胶合板脱胶信号如图5所示,信号以中低幅窄脉冲为主,波形为弯曲波模式和膨胀波模式的混合型,且弯曲波模式占主导。受膨胀波成分的影响,在200 kHz频率处也出现峰值,能量在大于100 kHz频域上有所分布,但主要集中在小于50 kHz的频域。从失效样品查看,明显存在分层和互相滑移现象,与上述分析基本一致。

观察图6发现,五层胶合板分层信号中傅里叶频谱的峰值主要位于11~55 kHz,小波时频图的特征峰主要集中在40 kHz处,持续时间约为1.2 ms,小波包谱能量主要集中在第一、二、三、四段,且第一、二段能量所占比重接近,总和占到了总能量的85%。信号多以中幅度宽脉冲形式为主,信号持续时间较长。分层是典型的垂直板平面方向的力源作用,信号明显存在频散现象,波形以弯曲波模式为主,能量主要集中在40 kHz以下。

图3~图6表明,信号的波形、频谱和小波包谱等类别特征均有不同程度的重叠,但对5种类别的信号均显示出一定的鉴别能力,尤其以小波包分析提取的特征更为明显,以该特征作为样本可为后续使用神经网络进行识别提供依据。

3.4 模式识别

按照第1.2所述方法对声发射信号进行5层小波包分解,将整个频段分成32个频带,考虑反应声源信号特征的能量主要集中在前10个频段,因此提取前10个叶子的能量分布为声发射信号特征,以此作为BP网络的训练样本。样本包含胶合板脱胶10组、纤维断裂10组、分层12组和基体开裂8组共计40组。网络在经过81次训练后达到设定的最小期望误差0.001(见图7)。采用网络对训练数据进行识别,识别正确率达到 100%。证明该网络具有较强的学习能力,能够按照给定的输入/输出正确建模。

为检验网络的推广应用性能,采用该网络对118组测试样本(脱胶30组、纤维断裂30组、分层28组和基体开裂30组)进行检验,识别正确率达到 92.6%。这表明该人工神经网络的范化能力较高,设计结构合理,达到自动识别声发射信号类别的目标,具有良好的推广价值。

4 结 论

(1) 针对声发射这种瞬间的突变信号,小波分析确实能很好地同时表现出时域和频域的局部特征;

(2) 综合各类模式信号的波形、频谱、小波包时频图和小波包能谱图分布等特征,可确定不同损伤机制所对应的声发射信号特征,为神经网络模式识别提供质量较高的模式样本;

(3) 设计的BP人工神经网络能准确度较高地识别出4种不同损伤机制造成的声发射信号。

由于木质胶合板的声发射研究国内开展的不多,对该类材料的声发射特征的分析及识别还待进一步研究,尤其对多层胶合板声发射特征的定量研究还有待于大量实验数据的积累和归纳。

摘要:为识别胶合板的不同损伤类型,将小波包时频分析与能量谱相结合,提出基于时频和频段能量占比的胶合板损伤声发射信号特征提取方法。研究得出胶合板基体开裂信号以膨胀波和弯曲波模式并举,频谱较宽,能量主要集中在小波能量谱的第一、二、三、四和七频段;分层信号频率单一,幅值较高,并以膨胀波为主;纤维断裂主要以弯曲波模式为主,频率较低;脱胶信号波形为膨胀波和弯曲波的混合型,以弯曲波为主,能量多集中于第一、二、三、四频段。用小波包提取的能量占比作为由BP神经网络构成的智能化模式分类器的输入样本,对4种声发射信号进行识别,正确率达到92.6%。

关键词:胶合板,声发射,小波包变换,神经网络

参考文献

[1]袁振明,马羽宽,何泽云.声发射技术及其应用[M].北京:机械工业出版社,1985.

[2]殷冬萌,王军,刘云飞.木塑复合材料缺陷及损伤的声发射信号特征分析及神经网络模式识别[J].应用声学,2007,26(6):352-356.

[3]JIAO Jing-pin,HE Cun-fu,WU Bin,et al.Application ofwavelet transform on modal acoustic emission source loca-tion in thin plates with one sensor[J].International Journalof Pressure Vessels and Piping,2004,81:427-431.

[4]QI Gang.Wavelet-based AE characterization of compositematerials[J].NDT&E International,2000,3(3):133-144.

[5]胡昌华,张军波,夏军,等.基于Matlab的系统分析与设计:小波分析[M].西安:西安电子科技大学出版社,1999.

[6]毛汉颖,成建国,黄振峰.基于BP神经网络的金属裂纹声发射信号特征参数的提取[J].机械设计,2010,27(2):84-86.

[7]陆仁书.胶合板制造学[M].2版.北京:中国林业出版社,1993.

[8]耿荣生,沈功田,刘时风.基于波形分析的声发射信号处理技术[J].无损检测,2002,24(6):257-261.

[9]LOWE M J S,DILIGENT O.Low-frequency reflectioncharacteristics of the s0Lamb wave from a rectangularnotch in a plate[J].Acoustical Society of America,2002,111(1):64-74.

[10]徐长发,李国宽.实用小波方法[M].2版.武汉:华中科技大学出版社,2004.

[11]杨晓楠,唐和生,陈荣,等.钢结构损伤识别中db族小波函数选择[J].同济大学学报,2006,34(12):1568-1572.

声目标识别 篇7

关键词:传感器网络,声震节点,特征量提取,目标分类

近年来,随着计算机、无线通信、微电子和传感器技术的飞速发展,无线传感器网络(WirelessSensorNetworks,WSNS)成为国内外研究的一个热点。WSN最早起源于军事领域,最为典型的是由声音、地震动、红外、电磁、化学等多种传感器组成的无人值守地面传感器(UnattendedGroundSensor,UGS)网络。随着WSN技术的不断发展,其应用范围开始向民用领域扩展,如长期的环境监测、反恐和公共安全、工业、医疗等的应用。UGS中各传感器节点连续采集外界信息,对周围事件进行探测、识别和定位。声音和震动节点是UGS系统中最重要的节点之一,并且最早出现在军事应用传感网络中,可以对地面人员、车辆和低空飞行等目标进行探测和分类。所以,对声震节点的信息处理,包括目标声音和震动信号的处理、分类、跟踪、定位算法,一直以来都得到了广泛的研究,至今仍然是国际上的研究热点之一[1,2,3,4]。国际光学工程学会(SPIE)召开了一系列UGS会议和国防与法律执行中的传感器与C 3I(command,control,communicationandintelli-gent)技术会议。

国际上比较有代表性的WSN有遥控战场传感系统(RemoteBattlefieldSensorSystem,简称REM-BASS—伦巴斯)、智能尘(SmartDust)和SensIT等项目。其中,SensIT系统主要由地震动和声音传感器组成,每一个节点都有一个分类器,声音和震动节点协同工作,就可以达到很高的分类性能[5]。尽管如此,传感网络中声音和震动目标的识别、分类和跟踪仍然是一项十分复杂的工作,因为系统在很大程度上受到外界环境的影响。同时,在WSN中,每个传感器的节点能量有限、可靠性差、无线模块的通信距离有限,并且与节点内的其他操作相比需要更多的功耗,这就对单节点的分类和识别算法提出了较高的要求,必须在提高分类能力的同时降低运算复杂度,满足低功耗的要求。

1声震节点信号采集、分析与预处理

声音和震动传感器成本相对较低,可用大炮飞机撒播或人工等多种方式进行布设,且易于集成。对地面车辆和人员目标,能够产生声音和震动信号,尽管两种信号发生机制、传播途径不同,但也有共同的特点。它们都属于非平稳随机信号,信号强度随着传播路径的增加而衰减,都容易受到背景噪声和外界环境条件的影响。Sleefe等人[6,7,8]对UGS系统声音和震动模态进行了分析,提出了在特定应用环境下的模态选择方法,并说明两种传感器都有各自特点,可以达到优势互补。Ketcham和Moran等人[9]建立了地面运动车辆目标的震源模型,利用有限差分时域(FDTD)方法模拟履带和轮式两类车辆地震波传播,讨论了不同地质条件的影响。Succi等[10]对地面人员脚步信号的探测和跟踪进行了研究,提出基于峭度(Kurtosis)统计量的人员信号探测方法。作为SensIT项目的一部分[6],LiDan等人[7]利用分布式传感网络对地面目标进行探测分类和识别。在传感网络中,要对目标实现高的探测率和识别率,首先必须了解目标信号源的发生、传播机理。

1.1地面目标声震信号发生机理

在实际战场环境下,地面目标主要有车辆、人员、直升机等,车辆目标又可以分为履带车(轻型重型)和轮式车辆(轻型、重型)。低空飞行直升机的噪音主要来自于旋翼、发动机和尾翼,从远场看,噪声主要是作用于旋转叶上的周期性气动力引起的噪声,它以压缩波的形式,以大约330m/s的速度向四面传播。地面车辆目标引起的声音信号主要来自发动机排气和进气噪声,所以不同发动机种类(柴油、汽油)产生不同的声信号。目标地震动信号的主要来源于推进装置(车轮或履带)对地面的连续性冲击和发动机的机械振动。所以,不同地面目标的声音和震动信号,都有周期性成分在里边,这样就为目标的分类和识别提供了条件[13]。人员活动产生的地震动信号不同于车辆或其它噪声,它是周期性的脉冲信号,脉冲周期与人员状态(走动、跑动)有关,一般约为2Hz。典型的地面履带车、轮式车产生的地震动信号如图1所示。

1.2 地面目标声震信号传播途径及环境影响

地面目标声音信号通过空气传播,所以信号在很大程度上受到天气条件、背景噪声、地质条件等因素的影响。在平坦地形和无风条件下,声音信号在目标和传感器之间沿直线传播。但在不平坦地形条件下,声波会出现反射、折射、散射和衰减的情况,使声信号的探测更加困难。另外,声音的传播速度还与大气温度和湿度有关。地震动信号的传播则更为复杂,且传播过程与环境因素更加相关,包括地形地貌、地质条件和外界干扰等。与声音信号相比,地震波的传播速度受外界影响较大,如在松软的土地中表面波的传播速度约200 m/s,而在硬岩石土地压缩波的速度达4 000 m/s[6]。按照介质质点运动的特点和波的传播规律,地震波可分为两大类,即体波和面波。Miller和Purssey证明了在半无限介质表面,地面波以Rayleigh波为主,占到总传输能量的70%。随着传输距离的增加,波动强度依指数规律衰减,如(D式)所示:

A(x)=A(0)exp(-α(f)x) (1)

(1)式中α(f)=ksf,f代表信号频率,ks代表衰减系数(单位:时间/距离)[14]。风雨雷电等天气因素容易耦合进入地震动传感器,从而影响其工作性能,为目标探测、分类带来困难。

从上面的分析可以看出,声震信号的传播过程容易受到外界环境的干扰,为目标识别带来实质性的困难。

2 声震节点目标探测和特征量提取方法

2.1 声震节点目标探测方法

在传感网络中,声音和震动节点实时采集并处理数据,节点内目标探测是进一步分类、识别的前提,在军事应用领域称为“预警”。如何有效地把噪声和目标信号区分开来,达到高的预警率和低的虚警率,是国内外学者广泛研究的问题,这也对传感器的灵敏度提出高的要求。Gramann等人[5]采用峰值挑选(peak picking)算法进行目标探测。Duarte和Hu[6]解决无线分布式传感网络中的车辆探测和分类问题,网络中每个节点都装备了板上处理器、无线收发器、一个声音或震动传感器和电池。他们采用基于能量的不变虚警率(Constant False Alarm Rate)算法来进行目标探测。当没有目标出现,节点工作在休眠状态,当有目标出现,进入分类过程。

在文献[7,10]中,作者研究地面人员的探测问题,深入分析了人员活动的产生的地震动信号。他们把地面车辆和其他因素引起的信号都看成噪声,对信号的峭度统计量作了大量的统计工作,峭度统计量的定义见表2,这里μ表示N个采样点的均值。震动信号峭度统计的各种情况包括:背景噪声加车辆、单个人员(跑动、跳动、不同距离)、多个人员,实验结果表明统计计算信号的峭度能够很好地探测地面人员目标。如图3、图4所示,分别说明了人员脚步引起的地震动信号及其峭度统计量的分布情况。

2.2 声震节点目标特征提取方法

特征提取是指通过某种映射(或变换)的方法,把原本处在高维空间中的样本映射到低维空间中的过程。为了提高识别系统的分类性能,各种各样的技术都被用来提取和选择地面目标声震信号的特征。从前面的分析可知,声震信号的非平稳特性为特征量的提取带来了困难,为了充分表达不同目标本质属性,特征量必须具有典型性、代表性和稳定性。从信号处理的观点来看,特征提取可以分为三类:时域特征、频域特征和时频特征,如表1所示。

Wellman等人[18,19]讨论了声震传感器目标识别的特征提取和融合问题,对地面车辆分类履带和轮式两类。对地面车辆声音信号(采样率2 kHz),分别从三个方面提取了特征参量:功率谱估计(PSEs)、HLA(Harmonic Line Association)和主成分分析(PCA),然后输入到BP神经网络进行训练,把分类结果作对比。对地震动信号,分析了功率谱的形状统计量[20],主要有形状、标准偏差、偏斜和峭度,其定义见表2。在文献[12,16,21]中,主要对地面车辆目标的震动和声音信号的功率谱进行分析,采用了以下两种方法:基于FFT的非参数方法和AR谱估计方法。Jams F. Scholl 等人[23]对目标震动信号进行小波和小波包分析,分别提取了基于小波能量和小波包熵的特征量。采用两种不同的小波基(Harr小波和Coeif2小波)分别对信号进行处理,并把结果与信号的功率谱进行比较,衡量标准采用L2准则。Choe[24]等人采用Harr小波和D4小波对目标声音信号进行分析,对算法的运算量进行评估,并与FFT算法相比较,为算法的实时硬件化实现提供参考。Munich[25,25]及Liu[26]讨论了基于Mel倒谱系数(MFCC)的声目标特征提取。

特征提取的好坏关系整个传感系统的性能,必须很好的予以评价、分析。简单的时域特征量和信号频谱分布尽管容易实现,但鲁棒性不好,容易受到外界噪声环境的影响。接下来,将重点介绍几种性能好,有应用前景的特征提取方法。

根据前面对目标声震信号发生机理的分析,信号中存在谐波成分,所以HLA特征被广泛的作为分类特征量。对一帧数据,作FFT变换,在频谱中找出m个最大峰值点,这里把每个峰值都看成是基频的k次谐波,所以就可以把前m个最大点频率序数作为特征量。一般把基频限制在一定范围之内,如ffund∈[8,20] Hz。Lake[27]讨论了用最大似然法来估计基频频率问题。同时,Wellman也指出了HLA特征在实时实现中的局限性,算法的几个步骤都要进行谐波匹配,所以必须对HLA算法予以改进才能实际应用。主分量分析(PCA)[28]是降维的主要方法之一,通过Wellman的对比实验结果可以看出,PCA特征的测试结果明显优于PSE和HLA方法,是值得考虑的。在Li Liu[26]的论文中,作者深入讨论了基于听觉模型的声目标特征提取,并利用矢量量化算法对结果进行测试,最好达到了92%的识别率。其中MFCC是重要的参数,最早被用来解决语音识别和说话人识别的问题,利用带通滤波器来模仿人耳听觉特性,可以减少噪声对声音信号的影响,它在低频段有较高的分辨率,所以适用于声目标识别。

小波变换是处理非平稳随机信号重要手段,在语音识别、地震动信号处理、图像处理中取得了广泛的应用。对目标声震信号,小波变换是特征提取的重要手段,首先对信号进行小波分解,根据小波(或小波包)系数计算各频段的能量或熵。Mallat塔式算法可以实现对离散信号序列的小波分解和重构,如(2)式所示。

cj+1,k=mh0(m-2k)cj,m,dj+1,k=mh1(m-2k)cj,m(2)

(3)式中,cj+1,kdj+1,k分别是尺度系数和小波系数。这样,信号被分解成低频概貌部分和高频细节部分,每个部分对应于一个子频段。若原始信号的采样率是Fs,那么第j个频段的频率范围是[Fs/2j,Fs/2j+1]。这样,计算出每个频段的总能量作为特征向量,由(3)式计算:

Ej=npjn2 (3)

(2)式中,pjn表示第j个频段的小波系数。在实际应用中,小波基的选择是很重要的问题,同时对算法的计算复杂度进行分析,使之满足传感节点内的要求。

3 声震节点目标分类算法

模式识别和人工智能技术的不断发展,为传感器网络的智能目标识别提供了理论基础和技术支撑。从传统的统计模式识别方法,到人工神经网络、SVM、模糊模式识别等,各种各样的学习和分类方法都被应用到目标识别的问题中来。在解决传感网中地面车辆分类的问题中,Li和Duarte[12,16]等人在提取目标信号PSEs的基础上,采用了最大似然估计法(ML)、k近邻法(KNN)和SVM相比较的策略,对不同分类器性能进行评估。结果表明,SVM的分类结果要优于其它两种方法。人工神经网络(ANN)方法的应用则更为广泛[13,19,29,30],该方法要求首先选择网络模型结构,然后利用样本数据对模型进行训练,所以在实时环境中的应用受到一定的限制。Wu和Mendel[31,32]应用模糊逻辑规则分类器(FL-RBC)解决基于声信号的地面车辆多分类问题,提取信号的HLA特征,分别对模糊分类器和贝叶斯分类器进行了比较和评价,结果表明模糊方法的分类性能要明显的优于Bayes方法。Goodman[25,25]利用提取地面人员和车辆的频谱特征,建立了高斯混合模型(GMM),利用期望最大化(EM)算法进行最大似然参数估计。Munich[25,25]讨论了基于STFT的贝叶斯子空间方法,对5类和9类分类问题的错误率分别是8.5%和11.7%。

尽管各种模式识别方法都被应用到声震信号识别的问题中来,但由于所用的样本数据和实验条件不同(如采样率、外场环境等),很难比较各种实验结果的优劣。同时,各种方法都有自身的优势和缺陷[34,34],所以对模型和方法的评判必须在真正的外场环境中进行。通过本文第1,2部分的讨论可以看出,分类算法不仅需要高的识别率,还必须考虑环境的适用能力和算法的复杂度,满足单传感器节点需求。对各种分类算法进行分析、比较,在实际环境下进行改进,有着重要的现实意义。下面,将按照统计模式识别、神经网络和SVM及模糊方法的顺序进行分析,重点讨论在传感网络中有实用前景的算法和模型。

3.1 统计模式识别方法

统计模式识别是模式识别最基本的方法之一,Bayes判别是其理论基础。一个模式,或者一个目标类型,用一个d维特征向量x(x1,x2,…,xd)来表示,假设有c个类别ω1,ω2,…,ωc,类条件概率密度函数写成p(x|ωi),那么就可以利用Bayes公式计算出后验概率p(ωi|x),如(4)式所示。

p(ωi|x)=p(x|ωi)Ρ(ωi)i=1cp(x|ωi) (4)

(4)式中P(ωi)是类别ωi的先验概率。这样,就可以利用Bayes规则进行判别。但类条件概率密度p(x|ωi)往往是未知的,所以对它的估计至关重要。在文献[6]中,提取了声震信号的功率谱特征,并假设类条件概率密度满足多元高斯分布,利用最大似然估计法(ML)估计出参数,然后利用Bayes法则进行判别。应用这个方法重要的前提是特征量是否严格的服从高斯分布,在不同的外界环境、目标状态条件下,特征量的均值和方差有很大的差异,所以必须应用这个方法必须建立多个参数模型。

高斯混合模型(GMM)[35,36,36,37,38]是单一高斯密度函数的延伸,可以平滑地近似任意形状的密度分布,近年来在语音、说话者识别及雷达目标中取得了很好的应用。设随机变量YRd满足k个高斯函数的混合分布,用(5)式来表示:

f(Y=y|θ)=j=1kαj1(2π)d|j|exp{-12(y-μj)Τj-1(y-μj)}(5)

(5)式中θ={αj,μj,j}j=1k,其中对j=1,…,k,满足条件αj>0,∑j=1kαj=1,μjRd,∑jd×d维正定矩阵。期望最大化算法(EM)是常用的参数估计方法,其基本思想是根据已有的数据来递归估计似然函数。文献[33]中所用的实验数据都是没有被原来的板上算法探测到目标的,而利用GMM算法在背景噪声中识别出了人员和车辆目标。

近邻法是统计模式识别中的常用算法,其特点是算法简单、易于实现,在文献[12,16]中采用了k近邻法来解决地面车辆目标分类问题。该方法把所有的训练集特征向量作为参考,在测试环节,求取每一个测试向量与训练集向量之间的距离,然后找出距离最小的前k个向量,根据这k个向量的类别表示结合多数投票法进行判别。可以明显的看出,当训练集样本的数很大时,算法要求的运算量和存储量将会非常巨大,不利于实时系统的实现。

3.2 人工神经网络和支持向量机(SVM)

人工神经网络经过几十年的研究和发展,已经在人工智能、模式识别和信号领域取得了广泛的应用,有大量文献讨论神经网络基本理论、应用和实现问题。以BP学习算法为核心的多层感知机(MLP)网络在模式识别中的应用较多,文献[19,30,39]采用该方法来解决地面车辆分类问题。BP算法可以用两个过程来描述:第一个过程是前向传播过程,输入信息从输入层经隐层传播各神经元的输出值;第二个过程是反向传播过程,输出误差逐层向前,算出隐层个单元的误差,并用此修正前层权值。从文献中报道的结果来看,BP神经网络取得了较好的识别率,可达到80%~90%,但这些结果大都是在实验室中算法模拟取得的。在实际应用中,BP算法有很多缺点,必须予以考虑[40],如算法收敛速度慢、可能出现局部极小值、网络的结构的确定缺乏理论指导、可能出现过拟合的情况等,使得网络的环境适用能力下降。所以,BP神经网络在实际环境中的应用受到传感网络节点低功耗、低成本等要求的限制。

与BP神经网络相比,径向基函数神经网络(RBFN)在学习速度、鲁棒性、泛化性等方面有很大的优势,对硬件成本要求低,所以在信号分类、人脸识别的嵌入式实现方面取得了广泛的应用[41,42]。径向基函数网络由三层组成,中间层就是径向基函数,常用的高斯函数如(6)式所示。

φj(x-cj)=exp[-(x-cj)Τ(x-cj)2σj2] (6)

(6)式其中cj是中间层第j个神经元基函数的中心,σj是基函数的宽度。对RBF神经网络的训练主要包括以下几个方面:基函数数量(隐层节点数)的确定、基函数中心和宽度的确定和隐层节点数的确定。J. Moody和C. J. Darken提出的训练算法具有代表性:在第1阶段,利用k均值聚类算法,即无监督学习方法来确定RBF的中心位置cj和宽度σj;在第2阶段,利用有监督学习方法,如LMS算法来确定中间层与输出层之间的权值。文献[43]讨论了利用RBF神经网络进行实时识别的实现问题,对算法的复杂度进行分析,用DSP芯片实现算法并进行优化,取得了满意的结果。所以,采用RBF神经网络的嵌入式实现方案,解决传感网络中的声震节点分类问题是完全可行的。

支持向量机方法(SVM)是在统计学习理论基础上发展起来的一种新的学习方法,近年来在文本分类、图像识别、手写识别、基因表达等领域取得了较为广泛的应用,并初步表现出了优于其它分类器的性能[44]。SVM方法是基于经验风险最小化,针对小样本情况的一种机器学习算法,可以在很大程度上解决模型选择与过拟合,非线性与维数灾难以及局部极小问题,并且具有很好的泛化能力。在文献[12,16]中,对声震目标信号分别采用最大似然、近邻法和SVM对进行分类,对比结果表明,SVM方法的表现明显优于其它两种分类器,分类正确率平均高出近5%。已有很多文献讨论SVM方法的实现问题,以解决算法的学习速度、存储需求等的问题,但作为一门新兴的技术,还有很多问题有待于研究,尤其是SVM的应用及硬件实现问题。所以,在无线传感网络分类问题中的应用也是一种新的尝试。

4.3 模糊逻辑规则分类器

如前所述,文献[31,32]采用模糊逻辑规则分类器解决声震节点多目标分类问题。模糊逻辑分类器是一个应用于分类识别的模糊逻辑系统,每一个类型的样本对应一条模糊规则,即用模糊集理论来处理目标声震信号的不确定性因素。Wu分别采用Type-1模糊分类器和Type-2模糊分类器进行了实验评估。给定一个待定的特征向量X(x1,…,xk),经过模糊化得到输入模糊集,然后通过模糊推理计算每条规则的适应度fl(x),这里假设有M个类别。综合各条规则,去模糊就可得到分类输出:

y(x)=i=1Μfl(x)gll=1Μfl(x) (7)

假设M=2,对Type-1模糊分类器,如果输出大于0则判为第一类,否则判为第二类。结果表明,Type-2取得了最优的分类正确率,错误率是6.26%。模糊逻辑分类器性能比较稳定,算法简单,计算量少,能够满足传感网络的需求。

4 总结与展望

本文对无线传感网络中的声震节点目标识别问题进行了讨论。声震目标探测、分类性能受到各种外界条件的影响,分析并提取高鲁棒性的特征参量、选择功能强大的分类算法才能满足实际环境的需求。本文旨在分析各种不同的信号处理算法,为传感网络的实际应用提供必要的理论参考。通过分析可以知道,各种方法都有各自的特点及局限性,首先必须对算法进行评估、选择,综合工程化的考虑对算法进行改进,才能满足传感器网络智能节点需求。

声震目标的预警和分类算法在实时环境中适用能力是需要进一步研究的问题,尽量提高识别率的同时降低节点内的功耗,为传感器网络的数据融合提供先决条件。可以预见,智能化、小型化的传感器是未来传感网络节点的发展方向,传感器本身不仅能够感知外界信号,而且集成了目标分类算法,组成智能化无线传感网络。

上一篇:升级研究下一篇:多媒体教学中的新问题