图像处理算法

2024-05-28

图像处理算法(共12篇)

图像处理算法 篇1

一、引言

图像对于我们并不陌生,它是用各种观测系统以不同形式和手段观测客观世界而获得的,可以直接或间接作用于人眼并进而产生视觉的实体。图像包含有大量的信息,因而存储和处理图像都不是一件简单的工作。但是,随着计算机的诞生和发展,人们有希望将对图像的存储和处理这一繁重的工作借助于计算机来实现,从而减轻人们的工作压力。

二、图像处理的意义

人们经常要对图像进行各种加工以改善图像的视觉效果;或对图像进行压缩编码以减少对其所需存储空间或传输时间的要求;利用图像处理也能够修改图形,改善图像质量,或是从图像中提起有效信息,还有利用图像处理可以对图像进行体积压缩,便于传输和保存;同时采用各种方法对图像进行复原和增强;对图像进行分割、描述和识别等。所以,推动图像处理技术也有了快速的发展,各种图像处理软件也随处可见。

三、图像处理算法

1、旋转算法

一般的图像旋转以图像的中心为原点,旋转一定得角度。如图所示,点(x0,y0)经过旋转θ后坐标变成(x1,y1)。

在旋转前:

旋转后:

写成矩阵的表达式为:

其逆运算如下:

如果图像是绕一个指定点(a,b)旋转,则先要将坐标系平移到该点,再进行旋转,然后再平移回新的坐标原点,假定旋转前的图像中心坐标是(a,b),旋转后的中心坐标是(c,d),则旋转变换矩阵表达式为:

因此:

在上面的转换公式中,令

其中a=l Width-1/2,b=l Height-1/2,c=l New Width-1/2,d=l New Height-1/2,l Width和l Height分别为旋转前图像的宽度和高度,l New Width和l New Height分别为旋转后图像的宽度和高度。

则可以推导出以图像中心为旋转中心点的图像旋转坐标[6]即公式为:

在实现左右方向的旋转时,我们选取角度θ的不同值,使得坐标值得以改变,以实现图像最终在方向上的旋转。

2、压缩算法

(1)JPEG的压缩算法

JPEG压缩算法可以用失真的压缩方式来处理图像,但失真的程度却是肉眼所无法辨认的。这也就是为什么JPEG会有如此满意的压缩比例的原因。下面先来讨论JPEG基本压缩法。

JPEG压缩过程

JPEG压缩分四个步骤实现:

⑴颜色模式转换及采样;

⑵DCT变换;

⑶量化;

⑷编码。

(1)颜色模式转换及采样

RGB色彩系统是我们最常用的表示颜色的方式。JPEG采用的是YCb Cr色彩系统。通过下列计算公式可完成数据转换。

JPEG通常有两种采样方式:YUV411和YUV422,它们所代表的意义是Y、Cb和Cr三个成份的数据取样比例。

(2)DCT变换

DCT变换的全称是离散余弦变换(Discrete Cosine Transform),是指将一组光强数据转换成频率数据,以便得知强度变化的情形。

DCT变换公式:

x,y代表图像数据矩阵内某个数值的坐标位置

f(x,y)代表图像数据矩阵内的数个数值

u,v代表DCT变换后矩阵内某个数值的坐标位置

F(u,v)代表DCT变换后矩阵内的某个数值

经过DCT变换后的矩阵数据自然数为频率系数,这些系数以F(0,0)的值最大,称为DC,其余的63个频率系数则多半是一些接近于0的正负浮点数,一概称之为AC。

(3)量化

图像数据转换为频率系数后,还得接受一项量化程序,才能进入编码阶段。量化阶段需要两个8*8矩阵数据,一个是专门处理亮度的频率系数,另一个则是针对色度的频率系数,将频率系数除以量化矩阵的值,取得与商数最近的整数,即完成量化。

(4)编码

Huffman编码无专利权问题,成为JPEG最常用的编码方式,Huffman编码通常是以完整的MCU来进行的。编码时,每个矩阵数据的DC值与63个AC值,将分别使用不同的Huffman编码表,而亮度与色度也需要不同的Huffman编码表,所以一共需要四个编码表,才能顺利地完成JPEG编码工作。

实现上述四个步骤,即完成一幅图像的JPEG压缩。

四、结束语

目前,针对图像处理技术的软件己在市场上亮相,对于图像处理的初学者和算法研究人员开发的学习实验用的系统已成为专业人士的主要研究课题。希望我所做的探索可为将来的研究开发提供一些思路和参考,可有所借鉴。

摘要:图像处理是一项通用性强、精度高、处理方法灵活、信息保存方便、传送可靠的技术。图像处理的应用领域涉及到人类生活和工作的方方面面。随着人类活动范围的不断扩大,图像处理的应用领域也随之不断扩大。

关键词:软件包,图像处理,MFC

参考文献

[1]熊江.面向对象的框架设计[J].西南师范大学学报.2003,28(3):249~252

[2]朱彦军.BMP位图文件的存储格式[J].电脑编程技巧与维护.2003,11:56~59

[3]陶胜.JPEG图像文件格式分析及显示[J].电脑编程技巧与维护.2001,7:98~100

图像处理算法 篇2

1、负责图像智能识别算法研究与实现;

2、算法验证、优化与测试;

3、负责公司图像识别产品的开发;

岗位要求:

1、模式识别、图像处理、信号处理、计算机科学与技术等专业及相关专业本科及以上学历;

2、2年以上相关工作经验或2年以上在校相关研究经验,在校期间从事图像模式识别算法研究、熟悉深度学习算法优先考虑;

3、具有图像处理、模式识别项目开发经验、熟悉OpenCV等图像处理库的优先 ;

4、熟悉常用的图像处理算法和机器学习算法,且有字符、文本处理相关经验,;

5、具有较强的分析能力和较强的创新意识,善于发现问题并提出可行性解决方案;

图像增强基本算法的分析 篇3

【关键词】图像;图像增强;算法

The Analysis of The Basic Algorithm to The Image Enhancement

Chang Da-jun

(Changchun Architecture & Civil Engineering College Changchun Jilin 130607)

【Abstract】Techniques of image enhancement aim at improving the interpretability or perception of information in images for human viewers,eliminating or attenuating unneeded information. This paper is developed according to the algorithm of image enhancement, and systematically investigated and compared. The advantage and defect of the above-mentioned algorithms as well as the suitable application of them.

【Key words】Image;Image Enhancement;Arithmetic

1. 图像增强意义

图像增强是数字图像处理过程中的重要研究技术。但条件影响致使获得图像效果不佳,这就要使用图像增强技术来改善视觉效果,如突出特点、提取特征参数等,都有利于对目标的识别、跟踪等。因此,在各个领域中都有应用。

2. 图像增强基本方法

2.1 空域邻域基本理论。

W为掩模系数,z为对应像素灰度值, mn为包含像素点总数。主要步骤为:(1)模板在图像中移动,并将模板中心与某个像素位置重合。(2)读取模板下各对应像素的灰度值,并与模板系数相乘,所得乘积累加。(3)将和赋值给模板中对应位置的像素。常用技术:邻域平均法、中值滤波法等。

图1 均值滤波

2.2 频域图像增强方法的基本理论。

频域增强是利用图像变换技术将原图像空间中的图像以某种形式转换到其它空间中,然后利用该空间特有性质进行图像处理,最后再转换回原图像空间中,致使获得处理后的图像。主要步骤是:(1)选择变换技术,将原图像变换到频域空间。

图2 中值滤波

图3 椒盐噪声的巴特沃斯地通过滤波

图4 椒盐噪声的指数低通滤波图像

(2)在频域空间中,依据处理目的设计转移函数同时进行处理。

(3)将所得结果用反变换得到增强后图像。频域图像增强技术:低通滤波、高通滤波、带通带阻滤波。

3. 实验分析

3.1 空域邻域实验分析。

3.1.1 邻域平均法。

以图像自带的eight.tif为例,对其人为地添加少量椒盐噪声,然后利用不同大小模板的均值滤波对其进行去噪处理。结果如图1所示:

从图1中可以看出,均值滤波去噪时,模板大小的选取至关重要,一般来说,模板越大,去噪能力越强,但同时也会是图像变得模糊。就像图1所示一样,选用3×3模板时,噪声虽然被减弱,但是仍能清晰得看见噪声的痕迹,选用5×5模板时,噪声被进一步减弱,但是图像变得比使用3×3模板时更模糊,而选用7×7模板时,噪声基本消失不见,但是图像也有些模糊不清了。

3.1.2 中值滤波法。

如果既要消除噪声又要保持图像的细节,可以使用中值滤波器。原因是由于中值滤波不是简单地取平均值,因此所产生的模糊比较少。结果如图2所示:

从图2中可以看出,尽管这里人为添加的噪声较多,但中值滤波仍然较好地滤去了椒盐噪声,且克服了均值滤波所带来的图像模糊现象。同时,也可以看到,去噪后的图像边缘保留了个别的噪声点,这是因为图像的分辨率不是3×3的整数倍,其右侧补0,而这些噪声点的灰度值位于中值排序的中间。

3.2 频域图像实验分析。

3.2.1 巴特沃斯低通滤波器。

对人为添加了少量噪声的图像pout.tif进行巴特沃斯低通滤波。结果如图3所示:

从图3可以看出,处理前的图像对比度虽然较高,但是噪声点太多。经过巴特沃斯低通滤波处理以后,噪声虽然消失,但图像相比处理前更为模糊,且图像中有明显的振铃现象。这是因为噪声点主要存在于高频段,而低通滤波允许处于低频段的像素通过,这就使得处于高频段的噪声点和图像轮廓边缘无法通过,因此图像变得模糊不清。

3.2.2 指数低通滤波器。

对人为添加了少量椒盐噪声的图像pout.tif进行指数低通滤波。结果如图4所示:

从图4可以看出,与图3相比,处理后的图像效果并没有明显改善,甚至图像变得更模糊了,造成这种现象的原因与在巴特沃斯低通滤波中产生模糊的原因基本相同,唯一不同的是在处理过程中引用的处理公式不同,也正是因为这一点,与巴特沃斯低通滤波相比,指数低通滤波的振铃现象有所缓解。

4. 结束语

图像增强技术是现今在计算机方面研究的重点内容,通过对有关基本方法的介绍来了解图像技增强术在今后应用的领域。

参考文献

[1] 柏春岚.基于空域图像的研究与分析[J].河南城建学院学报,2011年1月,第20卷第1期:57~60.

[2] 贾小军.基于MATLAB的图像增强技术研究[J].渭南师范学院学报,2008年3 月,第23卷第2期:68~70.

[3] 张娜.数字图像增强的方法.大众科技报[J],2006年,第8期:27~28.

【摘 要】图像增强是指按特定的的需要采用特定的方法突出图像中的某些信息,同时削弱和去除无关信息。本文围绕图像增强基本算法进行了比较,分析了各自的优缺点并指明了最佳适用场景。

【关键词】图像;图像增强;算法

The Analysis of The Basic Algorithm to The Image Enhancement

Chang Da-jun

(Changchun Architecture & Civil Engineering College Changchun Jilin 130607)

【Abstract】Techniques of image enhancement aim at improving the interpretability or perception of information in images for human viewers,eliminating or attenuating unneeded information. This paper is developed according to the algorithm of image enhancement, and systematically investigated and compared. The advantage and defect of the above-mentioned algorithms as well as the suitable application of them.

【Key words】Image;Image Enhancement;Arithmetic

1. 图像增强意义

图像增强是数字图像处理过程中的重要研究技术。但条件影响致使获得图像效果不佳,这就要使用图像增强技术来改善视觉效果,如突出特点、提取特征参数等,都有利于对目标的识别、跟踪等。因此,在各个领域中都有应用。

2. 图像增强基本方法

2.1 空域邻域基本理论。

W为掩模系数,z为对应像素灰度值, mn为包含像素点总数。主要步骤为:(1)模板在图像中移动,并将模板中心与某个像素位置重合。(2)读取模板下各对应像素的灰度值,并与模板系数相乘,所得乘积累加。(3)将和赋值给模板中对应位置的像素。常用技术:邻域平均法、中值滤波法等。

图1 均值滤波

2.2 频域图像增强方法的基本理论。

频域增强是利用图像变换技术将原图像空间中的图像以某种形式转换到其它空间中,然后利用该空间特有性质进行图像处理,最后再转换回原图像空间中,致使获得处理后的图像。主要步骤是:(1)选择变换技术,将原图像变换到频域空间。

图2 中值滤波

图3 椒盐噪声的巴特沃斯地通过滤波

图4 椒盐噪声的指数低通滤波图像

(2)在频域空间中,依据处理目的设计转移函数同时进行处理。

(3)将所得结果用反变换得到增强后图像。频域图像增强技术:低通滤波、高通滤波、带通带阻滤波。

3. 实验分析

3.1 空域邻域实验分析。

3.1.1 邻域平均法。

以图像自带的eight.tif为例,对其人为地添加少量椒盐噪声,然后利用不同大小模板的均值滤波对其进行去噪处理。结果如图1所示:

从图1中可以看出,均值滤波去噪时,模板大小的选取至关重要,一般来说,模板越大,去噪能力越强,但同时也会是图像变得模糊。就像图1所示一样,选用3×3模板时,噪声虽然被减弱,但是仍能清晰得看见噪声的痕迹,选用5×5模板时,噪声被进一步减弱,但是图像变得比使用3×3模板时更模糊,而选用7×7模板时,噪声基本消失不见,但是图像也有些模糊不清了。

3.1.2 中值滤波法。

如果既要消除噪声又要保持图像的细节,可以使用中值滤波器。原因是由于中值滤波不是简单地取平均值,因此所产生的模糊比较少。结果如图2所示:

从图2中可以看出,尽管这里人为添加的噪声较多,但中值滤波仍然较好地滤去了椒盐噪声,且克服了均值滤波所带来的图像模糊现象。同时,也可以看到,去噪后的图像边缘保留了个别的噪声点,这是因为图像的分辨率不是3×3的整数倍,其右侧补0,而这些噪声点的灰度值位于中值排序的中间。

3.2 频域图像实验分析。

3.2.1 巴特沃斯低通滤波器。

对人为添加了少量噪声的图像pout.tif进行巴特沃斯低通滤波。结果如图3所示:

从图3可以看出,处理前的图像对比度虽然较高,但是噪声点太多。经过巴特沃斯低通滤波处理以后,噪声虽然消失,但图像相比处理前更为模糊,且图像中有明显的振铃现象。这是因为噪声点主要存在于高频段,而低通滤波允许处于低频段的像素通过,这就使得处于高频段的噪声点和图像轮廓边缘无法通过,因此图像变得模糊不清。

3.2.2 指数低通滤波器。

对人为添加了少量椒盐噪声的图像pout.tif进行指数低通滤波。结果如图4所示:

从图4可以看出,与图3相比,处理后的图像效果并没有明显改善,甚至图像变得更模糊了,造成这种现象的原因与在巴特沃斯低通滤波中产生模糊的原因基本相同,唯一不同的是在处理过程中引用的处理公式不同,也正是因为这一点,与巴特沃斯低通滤波相比,指数低通滤波的振铃现象有所缓解。

4. 结束语

图像增强技术是现今在计算机方面研究的重点内容,通过对有关基本方法的介绍来了解图像技增强术在今后应用的领域。

参考文献

[1] 柏春岚.基于空域图像的研究与分析[J].河南城建学院学报,2011年1月,第20卷第1期:57~60.

[2] 贾小军.基于MATLAB的图像增强技术研究[J].渭南师范学院学报,2008年3 月,第23卷第2期:68~70.

[3] 张娜.数字图像增强的方法.大众科技报[J],2006年,第8期:27~28.

【摘 要】图像增强是指按特定的的需要采用特定的方法突出图像中的某些信息,同时削弱和去除无关信息。本文围绕图像增强基本算法进行了比较,分析了各自的优缺点并指明了最佳适用场景。

【关键词】图像;图像增强;算法

The Analysis of The Basic Algorithm to The Image Enhancement

Chang Da-jun

(Changchun Architecture & Civil Engineering College Changchun Jilin 130607)

【Abstract】Techniques of image enhancement aim at improving the interpretability or perception of information in images for human viewers,eliminating or attenuating unneeded information. This paper is developed according to the algorithm of image enhancement, and systematically investigated and compared. The advantage and defect of the above-mentioned algorithms as well as the suitable application of them.

【Key words】Image;Image Enhancement;Arithmetic

1. 图像增强意义

图像增强是数字图像处理过程中的重要研究技术。但条件影响致使获得图像效果不佳,这就要使用图像增强技术来改善视觉效果,如突出特点、提取特征参数等,都有利于对目标的识别、跟踪等。因此,在各个领域中都有应用。

2. 图像增强基本方法

2.1 空域邻域基本理论。

W为掩模系数,z为对应像素灰度值, mn为包含像素点总数。主要步骤为:(1)模板在图像中移动,并将模板中心与某个像素位置重合。(2)读取模板下各对应像素的灰度值,并与模板系数相乘,所得乘积累加。(3)将和赋值给模板中对应位置的像素。常用技术:邻域平均法、中值滤波法等。

图1 均值滤波

2.2 频域图像增强方法的基本理论。

频域增强是利用图像变换技术将原图像空间中的图像以某种形式转换到其它空间中,然后利用该空间特有性质进行图像处理,最后再转换回原图像空间中,致使获得处理后的图像。主要步骤是:(1)选择变换技术,将原图像变换到频域空间。

图2 中值滤波

图3 椒盐噪声的巴特沃斯地通过滤波

图4 椒盐噪声的指数低通滤波图像

(2)在频域空间中,依据处理目的设计转移函数同时进行处理。

(3)将所得结果用反变换得到增强后图像。频域图像增强技术:低通滤波、高通滤波、带通带阻滤波。

3. 实验分析

3.1 空域邻域实验分析。

3.1.1 邻域平均法。

以图像自带的eight.tif为例,对其人为地添加少量椒盐噪声,然后利用不同大小模板的均值滤波对其进行去噪处理。结果如图1所示:

从图1中可以看出,均值滤波去噪时,模板大小的选取至关重要,一般来说,模板越大,去噪能力越强,但同时也会是图像变得模糊。就像图1所示一样,选用3×3模板时,噪声虽然被减弱,但是仍能清晰得看见噪声的痕迹,选用5×5模板时,噪声被进一步减弱,但是图像变得比使用3×3模板时更模糊,而选用7×7模板时,噪声基本消失不见,但是图像也有些模糊不清了。

3.1.2 中值滤波法。

如果既要消除噪声又要保持图像的细节,可以使用中值滤波器。原因是由于中值滤波不是简单地取平均值,因此所产生的模糊比较少。结果如图2所示:

从图2中可以看出,尽管这里人为添加的噪声较多,但中值滤波仍然较好地滤去了椒盐噪声,且克服了均值滤波所带来的图像模糊现象。同时,也可以看到,去噪后的图像边缘保留了个别的噪声点,这是因为图像的分辨率不是3×3的整数倍,其右侧补0,而这些噪声点的灰度值位于中值排序的中间。

3.2 频域图像实验分析。

3.2.1 巴特沃斯低通滤波器。

对人为添加了少量噪声的图像pout.tif进行巴特沃斯低通滤波。结果如图3所示:

从图3可以看出,处理前的图像对比度虽然较高,但是噪声点太多。经过巴特沃斯低通滤波处理以后,噪声虽然消失,但图像相比处理前更为模糊,且图像中有明显的振铃现象。这是因为噪声点主要存在于高频段,而低通滤波允许处于低频段的像素通过,这就使得处于高频段的噪声点和图像轮廓边缘无法通过,因此图像变得模糊不清。

3.2.2 指数低通滤波器。

对人为添加了少量椒盐噪声的图像pout.tif进行指数低通滤波。结果如图4所示:

从图4可以看出,与图3相比,处理后的图像效果并没有明显改善,甚至图像变得更模糊了,造成这种现象的原因与在巴特沃斯低通滤波中产生模糊的原因基本相同,唯一不同的是在处理过程中引用的处理公式不同,也正是因为这一点,与巴特沃斯低通滤波相比,指数低通滤波的振铃现象有所缓解。

4. 结束语

图像增强技术是现今在计算机方面研究的重点内容,通过对有关基本方法的介绍来了解图像技增强术在今后应用的领域。

参考文献

[1] 柏春岚.基于空域图像的研究与分析[J].河南城建学院学报,2011年1月,第20卷第1期:57~60.

[2] 贾小军.基于MATLAB的图像增强技术研究[J].渭南师范学院学报,2008年3 月,第23卷第2期:68~70.

遗传算法在图像处理的应用研究 篇4

遗传算法是基于达尔文进化论, 在计算机上模拟生命进化机制而发展起来的一门新学科。它根据适者生存, 优胜劣汰等自然进化规则来进行搜索计算和问题求解。遗传算法已从不同学科还有领域得到了普遍的采纳, 从图像调整过程内进行采纳同样产生了非常明显的效果。

2. 遗传算法的基本概述

2.1 概念

遗传算法 (Genetic Algorithm) 简称GA, 是基于达尔文 (Darwin) 的生物进化论和孟德尔 (Mendel) 的遗传学说的推动而产生的非常科学合理的优化算法。

遗传算法定义开始为Bagley J.D于1967年率先表明的, 但是和遗传算法联系紧密的理论还有手段进行认真分析则始于Michigan大学的J.H.Holland博士, 于1975年发表《自然与人工系统中的适应性行为》, 在此著作内详细的说明了遗传算法相关理论还有研究手段, 制订了遗传算法相关定理还有模式, 通过这种方式给遗传算法做好了充分的准备。

2.2 基本原理

遗传算法主要从自然选择还有生物遗传学机理前提之下营造产生的, 按生物学的方法将问题的求解表示成种群中的个体 (用计算机编程时, 一般使用二进制码串表示) , 从而构造出一群包括个可行解的种群, 将它们置于问题的环境中, 根据适者生存和优胜劣汰的原理, 对该种群按照遗传学的的遗传算子进行选择、交叉和变异操作, 不断优化生成新的种群, 这样一持续的发展, 最后能够统一到和环境能够有机保持一致的个体中, 科学合理的解决问题。

2.3 基本操作

遗传操作是关于染色体的运算, 也叫遗传算子 (genetic operator) 。选择、交叉还有变异为非常关键的实施步骤, 共同营造产生了相应的遗传操作。

(1) 选择 (Selection)

选择 (Selection) 运算亦称为繁殖、再生或复制运算, 用于模拟生物界优胜劣汰的自然选择现象。此为从群体内找到能够和环境保持一致的个体, 随之借助此类个体进行培养, 所以部分情况下将其叫做再生 (Reproduction) 。但有时也称为非均匀再生 (differential reproduction) 是因为从找到进行培养的个体过程中, 能够按照个体自身实际适应水平科学合理的判断繁殖量。选择为非常重要的步骤, 能够有效的展示适者生存综合观念。

(2) 交叉 (Crossover)

选择操作能把优秀者从旧种群中选择出来, 但不能创造新的个体。交叉操作则模拟了生物进化过程中的繁殖现象, 从所有进行分析的个体之内, 能够在基因码链一个地点基因开展相应的处理, 从而产生新的个体。

(3) 变异 (Mutation)

变异模拟了生物进化中基因偶然突变现象。这是在选中的个体中, 对个体中的某些基因进行反操作。在以二进制编码的系统中, 染色体的某个基因被随机地由1变为0, 或由0变为1。

遗传算法具体实施步骤能够参考下述:

个体的适应度达到给定的阀值;或者个体的适应度的变化率为零, 根据这一准则来决定是否结束操作。

2.4 应用领域

由于遗传算法水平持续提高, 和遗传算法联系紧密的活动不断出现, 遗传算法慢慢变作了不同学科、不同领域有机结合的关键分析目标。遗传算法能够从不同角度得到了合理的采纳。当前阶段, 研究者表示从人工智能分析过程内, 遗传算法跟人工智能一样, 已成为影响今后十年的关键计算技术。

3. 遗传算法在图像处理中的应用

图像处理就是对图像信息进行了加工处理, 以满足人的视觉心理和实际应用的要求的过程, 是计算机视觉内非常关键的分析目标。从在图像开展扫描、特征搜集、图像分割等调整环节内肯定将产生部分问题, 造成了计算机视觉实用化水平无法快速提高。要使这些误差达到最小, 则需要对这些图像进行处理, 当中涉及大量的优化计算。把遗传算法应用到图像处理, 最重要的一点是利用遗传算法的全局搜索算法, 快速取得函数最优解, 从而得到较好的处理效果。目前已在图像处理中的各种手段能够得到普遍的采纳。

3.1 遗传算法在图像变换中的应用

图像变换是图像增强、图像恢复、图像编码压缩、图像分析描述等的基础, 包括几何变换和可分离正交变换, 常进行的是线性正交变换运算。常采用的图像变换方法有沃尔什-哈达玛;哈尔变换;离散余弦变换;傅立叶变换;小波变换等。

遗传算法应用于图像变换主要解决问题是构造适应度函数。也就是在改变像素的空间位置或估算新空间位置上的像素值中, 遗传算法能够进行并行统计, 能够有效的减少调整运算所需要的实践, 能够合理解决问题, 保证工作质量和水平。从具体实施过程内各种管理参数规模庞大, 往往要借助经验, 所以, 怎样科学合理的管理此类参数, 有效保障变换质量和水平, 应当不断进行分析还有研究。

3.2 遗传算法在图像去噪中的应用

在存在噪声的图像内开展调整为图像处理的起步时期, 同时为图像处理非常关键的环节。降低噪声的手段主要包括了维纳滤波、中值滤波、混合滤波、小波去噪等等, 另外小波去噪质量非常高。

遗传算法能够从具体实施过程内得到合理采纳, 绝大多数为另外滤波器发现合理的参数。在输入图像中, 第一应当系统研究图像自身灰度级范围值还有具体布局现状, 按照输出图像还有输入图像实际灰度对应关系开展相应的调整, 随之能够按照图像质量评价标准营造产生科学合理的适应度函数, 随之能够借助遗传算法持续开展实践活动, 能够发现非常科学合理的灰度变换关系, 随后能够在图像中开展相应的调整, 遗传算法通常无法从图像滤波内得到合理采纳, 主要与另外算法有机统一得到采纳。文献[7]即为借助GA优化数学形态滤波器内top-hat交换和bottom-hat变换的系数, 文献[9-10]主要借助了GA优化模糊隶属度函数。

3.3 基于遗传算法的图像增强

图像增强涉及的操作包括图像降噪、图像特征提取、目标轮廓抽取、黑白图像假彩色生成技术等。遗传算法作为一种智能优化算法在图像控制角度产生的影响关键为发现管理参数的正确答案, 随之实现图像的自适应增强。

在对一幅图像增强过程中, 重新构造新的变换函数, 采用实数编码, 以一个一维五元数组表示一条染色体, 每个参数对应一个基因位, 这样函数的参数范围非常大, 在这样大空间进行搜索, 遗传算法将发挥其优势。遗传算法中个体进化的动力就是所要构建的适应度函数。适应度函数设计就是要兼顾图像的整体与局部, 大的结构和小的细节平衡体现[13]。适应度函数如下:

根据函数执行遗传算法的交叉和变异算子, 实验证明该方法具有较强的自适应性和鲁棒性, 而且得到更好的增强效果。

3.4 基于遗传算法的图像恢复

图像恢复实际就是图像的优化, 利用合适的算法可以使得图像复原到最佳的效果。遗传算法中用适应度来衡量种群中各个染色体在算法运算中可能达到或者接近于最优解的程度, 较大可能遗传到下一代的只能是适应度高的染色体。对于图像复原问题, 适应度函数的确定涉及需复原图像的退化模型, 准确的模型可以最大程度地恢复原始图像。

遗传算法往往能够从灰度图像调整过程内得到合理采纳, 通常把染色体编码变作将不同灰度值当作基础的2维矩阵, 也就是一幅图像当成一个染色体、一个像素当成一个基因, 有效借助自然数编码。所有适应度函数均是F (fi) =||g-h*fi||2

另外, f为个体i所象征的推测恢复图像, g是当前掌握的退化图像, h是退化过程, 函数值往往和个体呈现正比例关系;从交叉具体实践过程中通常借助窗口交叉, 也就是从父代染色体矩阵内找到比较类似的窗口, 开展沟通交流。变异操作能够把彼此相邻的平均值调整还有要进行变异的基因值。整个遗传算法涉及的参数较多, 每一种参数的不同组合, 其对应的遗传算法性能也各异, 最终得到的恢复图像也不尽相同。

3.5 遗传算法在图像分割中的应用

从调整繁琐图像的过程中, 研究者通常要借助多参数开展相应的调整, 从多参数调整环节之内, 优化计算为特别关键的。应用遗传算法除了能够发现最优解, 同时能够有效保证计算效率。在图像分割时用来帮助确定分割阈值, 这是我们将遗传算法引入图像分割的主要目的。文献[11]能够把遗传算法还有神经网络算法有机统一对图像进行调整, 也就是在神经元网络内借鉴遗传算法开展相应的调整, 同时能够有效借助遗传参数, 能够表明不同的级别开展相应的调整。文献[12]能够把遗传算法从图像分割手段内得到合理的采纳, 能够有效的保证图像分割效率还有保证图像处理的时效性。把遗传算法从不同分割手段中进行采纳能够有效的保证工作效率, 找到合理分割阀值为现阶段非常关键的分析热点。

3.6 遗传算法在图像融合中的应用

图像融合技术主要应用于军事、遥感、医学图像处理、自动目标识别以及计算机视觉等领域。众多的融合方法中, 最经典的方法有基于色彩空间变换的IHS变换、Lab变换、YUV变换;基于统计方法的主成份分析、Brovey变换以及基于多尺度分析融合方法的金字塔分解和小波变换[14]。

基于遗传算法的图像融合, 主要是结合图像融合技术, 为其构造的函数提供最佳匹配的快速搜索, 从而加快图像进行寻优速度。基于遗传算法的图像融合过程, 可以简单地作如下概述:首先利用融合方法来获取作为初始粒子的图像, 然后根据后续图像处理的需要来构造目标函数, 再利用遗传算法来优化目标, 从而获取合适的图像。

3.7 基于遗传算法的图像识别

图像识别是通过对采集到的图像进行分析研究, 从而提取目标的特征。作为模式识别范畴的图像识别, 最重要的处理是图像匹配。在图像识别技术之内有效借鉴遗传算法关键为处理部分识别效率难点, 也就是能够借助降低搜索位置规模有效的降低计算总量;另外从精度性识别角度同样产生了非常明显的效果, 同时遗传算法能够避免出现明显波动。

进行图像识别过程中, 将原始图像矩阵变换成列向量来重新构造图像的协方差矩阵, 从而造成图像的维数较高, 加大了整个特征抽取过程所耗费的计算量。引入遗传算法, 先采用图像识别方法进行特征提取, 再用遗传算法对提取的特征进行优化, 从而大大降低了特征空间的维数, 而且具有很好的分类效果, 提高了图像的识别率。

4. 结语

遗传算法主要为和生物进化非常相像的优化搜索算法, 能够借助选择、交叉还有变异操作算子, 借助种群迭代, 找到最优解。另外鲁棒性还有避免函数限制等突出性质造成了能够从不同领域得到合理的采纳。能够把遗传算法从图像处理过程内得到合理的采纳, 首先能够给图像处理指明方向, 其次能够推动遗传算法覆盖面不断延伸。

摘要:介绍了遗传算法的基本概念和基本原理, 分析说明了遗传算法的基本操作以及应用领域;重点概述了遗传算法在图像变换、图像增强、图像恢复、图像分割、图像识别等方面的图像处理中的应用。

图像算法工程师的具体职责 篇5

1、 为研发项目在图像处理系统的需求进行评估,并进行有效的开发和测试,制定解决方案,进行验证和分析;

2、对现有的项目进行升级维护,及时收集和反馈现场问题,并进行解决;

3、对目前比较流行的图像处理算法,进行学习和研究,丰富公司图像核心算法库;

4、对部门的算法应用工程师进行技术培训,增强算法应用工程师在醒目和技术方面的能力

招聘要求:

1、 硕士及以上学历,有图像算法开发经验者优先;

2、 熟练掌握C++,python等编程语言,有跨平台移植和开发经验者优先;

3、 精通图像处理基础知识,熟悉模式识别的基本原理和方法,有深度学习模型训练和项目开发经验者优先;

图像处理算法 篇6

关键词:最大熵法;改进遗传算法;图像分割;作物病害;叶片病斑

中图分类号: TP391.41;S126文献标志码: A文章编号:1002-1302(2015)09-00453-02

作物病害叶片图像分割是一种基本的计算机视觉技术,也是由叶片图像处理进入病斑分析、识别的关键步骤,一直是作物叶片图像处理领域的一项重要研究内容。作物叶片的病斑特征直接反映作物病害的危害程度,病斑是作物病害识别的依据。利用图像处理技术进行作物病害叶片图像分析和识别以及病害的智能化诊断已经成为一个重要研究方向[1-4]。目前已经有很多作物病害的识别方法,这些方法均是利用作物病害叶片进行病害识别,其关键步骤是从病害叶片图像中将病斑图像分割出来[5]。实践表明,病斑图像分割效果直接影响后续病害识别算法的准确率。Valliammal等提出了基于模糊聚类的病害叶片分割方法,取得了较好的分割效果[6-7];任玉刚等提出了一种基于分水岭算法的作物病害叶片分割方法[8];王红君等提出了一种基于分水岭与自动种子区域生长相结合的病害叶片分割方法,利用该方法能够在复杂背景下将叶片病斑完整地分割出来[9];耿长兴等提出了一种基于可见光波段的黄瓜霜霉病的分割方法[10]。由于病害叶片的复杂多样性,使得上述这些分割方法均有各自的适合场合,不能对所有病害叶片图像分割的效果都有效。本研究将遗传算法(genetic algorithm,GA)和最大熵阈值法有机地结合起来,提出一种作物病害叶片病斑分割方法,并应用于病害玉米叶片图像分割中。该算法有效提高了病害叶片图像的分割速度,增强了分割算法的实时处理能力。

1最大熵阈值分割原理

最大熵图像分割算法在图像质量较好和背景稳定变化时,可以取得比较理想的分割结果。对于灰度范围为0~255的病害叶片图像,假设图中灰度级低于t的像素点构成病斑区域(gi),灰度级高于t的像素点构成背景区域(Gi),则各个灰度级在两区域的分布概率分别为:

当熵函数取得最大值时,对应的灰度值T就是所求的最佳阈值,即

T=argmax0≤t≤255 H(t)。(6)

2最大熵算法与GA相结合的图像分割方法

最大熵算法的求解原理是在解空间中找到一个最优解,使得图像中目标与背景分布的熵最大。GA是一种基于生物自然选择和遗传机理的随机搜索算法,具有强大的全局最优解搜索能力和信息处理的隐并行性以及应用的鲁棒性。只要检测少量结构就能反映搜索空间较大的区域,并可获得稳定的最优解。GA是一个以适应度函数为依据,通过对种群中的个体施加遗传操作,实现种群内个体结构重组的迭代过程,逐渐逼近最优解。将GA与最大熵算法相结合,能够得到病斑图像分割的最佳阈值。其病斑图像分割过程描述如下:(1)数据输入。读入作物病害叶片图像,将其转换为灰度图像。(2)编码方式。将种群中的各个个体编码为8位二进制码,每个个体代表1个分割阈值,即用00000000~11111111之间的一个8位二进制代码代表一个图像分割阈值。(3)确定算法参数。种群规模n定为20,最小迭代次数为10。当迭代次数超过该值后,检查每代种群中最优个体适应度的变化,若变化很小,即终止算法。在运算的初始阶段取较大的交叉概率(Pc=0.5)和较小的变异概率(Pm=0.02),以便尽快搜索出最优个体。当迭代过程中种群个体的适应值难以继续增大时,将交叉概率减小10%、变异概率增加20%,由此可提高收敛速度,避免陷入局部极值。(4)种群规模设置。随机在0~255 之间以同等概率生成n个个体I1~In作为第1次寻优的初始种群。种群规模设置应该合理,若种群规模过大,则适应度评估次数增加,计算量增加;种群规模过小,可能会引起未成熟收敛现象。(5)适应度函数设计。适应度函数是对个体进行遗传操作的依据,要能反映个体进化的优良程度,即个体有可能达到或接近问题最优解的程度。本算法采用式(5)作为适应度函数。(6)解码。对二进制个体组解码为0~255之间的实数,求其适应度值。(7)选择操作。选择操作先进行赌轮法,再采用精英策略。其具体过程为先计算各个体的适应度的总和S,再随机生成0~S之间一个随机数k,然后从第1个个体开始累加,直到累加值大于该随机数k,此时最后一个累加的个体便是要选择的个体。如此重复形成用于繁殖的新种群 。(8)交叉操作。采用单点交叉,在I′1~I′n中每次选取2个个体按设定的交叉概率进行交叉操作,生成新代的种群I″1~I″n。(9)变异操作。采用基本变异算子,按设定的变异概率随机从I″1~I″n中选择若干个个体,再随机从这些个体中选择某一位进行变异运算。从而形成新代种群I1~In。(10)对经过遗传操作后的个体采用小生境技术,由于对适应度小的个体使用惩罚函数,可大幅提高其被淘汰的概率。(11)终止准则。没有满足某种停止条件,则继续上述操作,否则进入(5)。以迭代次数为终止条件,达到预定的最大迭代次数,则算法终止。当算法执行到最大进化代数(或满足终止条件),种群中的最高适应度值仍未发生变化(稳定条件)时,算法停止运行,具有最高适应度值的个体即为分割阈值;否则以新代种群I1~In转到步骤(5)。本算法的终止准则,为当相邻2代的个体的平均适应度值小于0.001时停止迭代。

3结果与分析

在Matlab 7.0 环境下,编程实现本研究提出的基于最大熵和GA的病害叶片图像分割算法,并以实际采集到玉米病叶图像为测试对象进行试验验证。试验所用的计算机的配置为Intel Core Q6700 2.66 GHz 中央处理器,4 G 内存,Windows XP 操作系统。叶片图像的初始尺寸为1 600像素×1 200像素[1]。为提高处理速度,在实验室进行调整和剪切后尺寸为512像素×512像素。

采集到的玉米病害叶片图像为RGB模型,它使用红、绿、蓝三原色的亮度来定量表示颜色。在Matlab 7.0中,1幅大小为M×N[2]的RGB彩色图像可以用一个M[3]×N[4]×3的矩阵来描述,图像中的每一个像素点对应于红、绿、蓝3个分量组成的三元组,各R、G、B单一矩阵里每个元素值表示该元素的灰度值。使用rgb2gray()函数将RGB叶片图像转换成灰度图像,利用本研究提出的图像分割方法进行病斑分割,本研究采用英国谢菲尔德大学开发的基于Matlab的GOAT工具箱。个体种群数目NIND=20、最大遗传代数MAXGEN=100、代沟GGAP=0.9、变量的二进制位数PRECI=8,选择、交叉和变异的算子分别取GOAT工具箱中的select、recombin和mut函数,其适应度函数选择为式(5)。经过50次迭代,选取阈值M=112,分割出的二值图像如图1-C。由此可以看出,本研究方法能较好地分离出病斑部分。为了突出本研究方法的优越性,图1-D给出了图像分割中常用的迭代阈值法的分割结果[11]。通过对比发现,迭代阈值法的分割结果不完整,部分病斑发生了缺失现象,而且分割结果中还存在许多由于噪声和细小纹理所导致的小斑点,而这些小斑点对实际病害识别的意义不大。试验结果说明较之迭代阈值法,本研究方法能够取得更好的分割效果。

4结论

为了改善作物病害叶片图像的分割效果,提出了一种基于最大熵和GA的病害叶片图像分割方法。该方法充分利用GA的最优寻优特性,将图像分割的信息熵作为适应度函数。试验结果表明,本研究方法能够对作物病害叶片图像进行准确分割,比其他病害叶片图像分割方法具有更好的分割效果。虽然本研究方法在分割的准确性上取得了较好的效果,但是,针对部分重叠病斑,本研究方法难以将它们完全分离,下一步拟对其进行改进以解决此问题。

参考文献:

[1]Chaudhary P,Chaudhari A K,Cheeran A N,et al. Color transform based approach for disease spot detection on plant leaf[J]. International Journal of Computer Science and Telecommunications,2012,3(6):65-70.

[2]Al-Hiary H,Bani-Ahmad S,Reyalat M,et al. Fast and accurate detection and classification of plant diseases[J]. International Journal of Computer Applications,2011,17(1):31-38.

[3]Arivazhagan S,Newlinshebiah R,Ananthi S,et al. Detection of unhealthy region of plant leaves and classification of plant leaf diseases using texture features[J]. Agric Eng Int,2013,15(1):211-217.

[4]Song K,Liu Z K,Su H,et al. A research of maize disease image recognition of corn based on BP networks[C]//2011 Third International Conference on Measuring Technology and Mechatronics Automation,2011:246-249.

[5]刁智华,宋寅卯,王欢,等. 基于植物病斑的图像分割研究综述[J]. 农机化研究,2012,34(10):1-5,11.

[6]Valliammal N,Geethalakshmi S N. A novel approach for plant leaf image segmentation using fuzzy clustering[J]. International Journal of Computer Applications,2012,44(3):10~20.

[7]Arivazhagan S,Shebiah R N,Ananthi S,et al. Detection of unhealthy region of plant leaves and classification of plant leaf diseases using texture features[J]. Agric Eng Int,2013,15(1):211-217.

[8]任玉刚,张建,李淼,等. 基于分水岭算法的作物病害叶片图像分割方法[J]. 计算机应用,2012,32(3):752-755.

[9]王红君,陈伟,赵辉,等. 复杂背景下植物叶片的彩色图像分割[J]. 中国农机化学报,2013,34(2):207-211.

[10]耿长兴,张俊雄,曹峥勇,等. 基于色度和纹理的黄瓜霜霉病识别与特征提取[J]. 农业机械学报,2011,42(3):170-174.

基于遗传算法进化的数字图像处理 篇7

人脸面部表情识别已经成为数字图像处理领域的研究热点, 最近20年很多表情识别方法被提出。现在, 国际上研究表情识别的方法主要有几何法和统计法。几何法中最典型的是面部运动编码系统 (FACS) 和MPEG24中的面部表情参数 (FAP) 模型。它们都是根据解剖学的原理对各种人脸表情反应在脸部肌肉的运动定义的, 利用类似于知识识别的方法来进行识别的。

本文提出了一种基于遗传算法进化的支持向量机进行人脸表情识别的新方法。同其他机器学习算法一样, 当SVM用于模式识别时, 首先要解决的问题是如何选择算法的参数以到得到好的分类性能。由于支持向量机的推广性取决于核函数及其参数的选择, 核函数参数主要影响样本数据在高维特征空间中分布的复杂程度, 因此要想获得性能良好的SVM分类器, 首先要选择合适的核函数参数将数据映射到合适的特征空间。目前对其核函数及其参数的选择主要依赖经验, 为了提高识别率和识别速度, 本文采用遗传算法对支持向量机的核函数参数进行最优筛选。由于遗传算法的主要特点是利用群体搜索策略和群体中个体之间的信息交换, 且搜索过程不依赖于梯度信息, 所以它尤其适用于处理传统搜索方法难以解决的复杂和非线性寻优问题。实验证明, 采用遗传算法进化的支持向量机进行分类可以得到很好的人脸表情识别率和鲁棒性。

1 支持向量机的分类策略

支持向量机的基本原理是基于两类数据的分类的, 但在实际问题中, 往往要解决的问题都是多类数据的分类, 因而就需要结合其它的分类策略来解决这些问题。在解决多类数据的分类时已经形成了一些很好的方法, 主要的方法有以下两种:

1.1 一对一 (One-against-One) 方法。

此方法是在对有N个训练样本时, 选择其中一个样本和其它每个样本分别训练一次, 这样每个样本都会训练次, 这样就需要训练次, 就会形成个分类器, 在识别的时候, 选择一个样本带入这些分类器中, 看它属于哪一类的次数最多就将此样本判为哪一类。

1.2 一对多 (One-against-All) 方法

此方法是在对有个训练样本时, 选择其中一个样本作为一类, 其它所有样本作为另一类, 这样得到一个分类器, 然后再选一个样本作为一类, 再将剩下的作为另一类再得到一个分类器, 识别时直接将样本带入这个分类器中, 判别属于哪一类就是哪一类。

2 基于遗传算法进化的支持向量机

同其他机器学习算法一样, 当SVM用于模式识别时, 首先要解决的问题是如何选择算法的参数以得到好的分类性能, 由于支持向量机的推广性取决于核函数及其参数的选择, 核函数参数主要影响样本数据在高维特征空间中分布的复杂程度, 因此要想获得性能良好的SVM分类器, 首先要选择合适的核函数参数将数据映射到合适的特征空间, 目前对其核函数及其参数的选择依赖经验, 为了提高识别率和识别速度, 本文采用遗传算法对支持向量机参数进行最优筛选。

遗传算法是由Darwin进化论和Mendel的遗传学机理而产生的直接搜索优化方法, GA将所寻优参数的解表示成染色体形式 (个体) , 将可能的解组成一染色体群, 根据适者生存的原则从群体中选择出适应性更强的个体进行复制、交叉等基本操作产生新的个体, 直到满足性能要求时为止, 其流程如图1所示.将遗传算法用于优化SVM参数时, 其计算过程如下:

2.1 首先初始化, 在参数空间随机产生一组群体, 群体大小N的选取一般为染色体长度的2-3倍.对染色体进行编码, 因最佳核函数参数的搜寻过程是一个复杂的连续参数优化问题, 所以采用浮点数编码方式以避免二进制字符串有限的长度对进化算法性能和求解精度的影响, 染色体的长度与所寻优参数的个数及参数取值范围有关;有时为了提高精度解码时需进行论域转换, 根据个体的适应度函数值来决定应复制的个体数, 继而按适应度的大小进行排序。

2.2 接着进行交叉、变异操作, 交叉是将一对染色体按单点或多点进行交换重组.变异是以一定概率改变染色体某点的状态[9].在遗传算法中, 交叉与变异的概率对遗传算法的性能有很大的影响, 变异操作一般选取范围是交叉概率为0.5-1.0, 变异概率为0.005-0.1, 具体问题应反复试验.重复进行上一步直到产生N-1个新一代的个体, 连同上一代中性能最好的那个个体组成新的群体.给出最佳的核函数参数和惩罚因子, 用其训练新的群体直到所有的个体都达到要求为止, 群体中适应度最高的染色体所表示的参数就是所要求的解, 利用寻优所得合适的核函数, 通过非线性变换即可在新空间获得最优分类面。

3 基于支持向量机的表情分类

表情特征矢量得到后, 本文使用SVM中的一对多方法作为判别标准。SVM分类函数形式上类似于一个神经网络, 输出是中间节点的线性组合, 每个中间节点对应一个支持向量, 如图2所示:

在表情分类中, 为了提高分类精度, 每一类的识别被视为一个独立的两类分类问题。4类表情记为L={aÁ, aÂ, L, aÁ}, k=1, L, 4。设属于类αi的表情个数为Ni, 将4类的分类问题转化为两类问题:对任何一类αi, 训练的正例是该类包含的全部表情图像Ni, 反例是所有不属于此类表情的图像, 所以如果每类表情图像的数目相等, 则正例要比反例少很多, 能够让分类器得到足够的学习。

4 实验

4.1 实验数据与预处理

本文所做仿真实验是在Yale face人脸表情数据库上进行的。Yale库中包含15个人的4种表情 (如图3所示, 由左至右依次为高兴、悲伤、惊奇、中性) , 共165幅图像, 均为320×243的8位灰度图像。进行特征提取前需对库中的图像进行预处理, 分3步进行:

对原始图像进行切割, 保留面部的主要特征区域;

将切割后的图像作压缩和几何归一化, 处理后的图像尺寸为64×64;

进行光照补偿和灰度归一化处理。

4.2 实验方案

在两个数据库上进行实验, 从耶鲁大学的Yale face数据库中选取60幅人脸图像, 共15个人, 4幅/人, 其中训练样本56幅, 14个人, 4幅/人, 测试样本为剩下的4幅图像, 1个人, 4幅/人, 通过随机变换训练样本和测试样本, 我们重复15次这样的实验。通过随机变换训练样本和测试样本, 我们重复10次这样的实验。

4.3 实验结果与分析

表1为采用Yale face图像库时各分类器的识别结果对比, 从表中结果可以看出, 通过PCA和FLD提取表情特征, 利用SVM进行分类得到了更好的分类效果, 同时也可看出基于PCA和FLD提取特征的分类结果比单独使用PCA和FLD提取特征的分类结果有所提高, 这是因为PCA和FLD在使样本的类间距离最大化的同时使得类内距离最小。

5 结论

本文通过PCA和FLD提取静态人脸表情图像特征, 将SVM分类器应用于表情识别, 并与单独使用一种方法提取特征作比较, 本文中的方法得到了更好的识别结果, 说明了利用PCA和FLD进行表情特征提取是可行的。最后须指明的是, 本文实验中PCA与FLD提取的是表情的统计特征, 它注重的是能量统计信息, 而对表情变化在几何细节上体现不够, 如能有效提取表情几何细节信息对于提高整体识别率将是很有意义的。本文实验中用到的Yale face数据库是静态表情图像库, 而人脸表情是一个行为过程, 表情差别更主要反映为动态的变化信息, 尤其是生气、厌恶、恐惧和悲伤在静态图像上有更多的相似之处。人之所以能较准确地由静态图像区分表情, 是因为可以根据以往知识和经验联想出表情的动作过程。因此有理由相信, 如果能利用多帧序列图像提取动态信息作表情分类, 将会有更好的识别效。

摘要:人脸表情识别是目前数字图像处理领域比较活跃的研究课题。本文提出一种采用遗传算法进化的支持向量机对人脸表情进行分类的新型算法。先提取静态人脸表情特征, 然后采用遗传算法自动选择最优的支持向量机核函数, 最后采用这种新型分类器进行了人脸表情的分类和识别。在Yale人脸表情库上进行了测试人不参与训练的仿真实验, 并与最近邻分类器进行比较, 提出的方法取得了更好的识别结果。

关键词:表情识别,支持向量机,遗传算法

参考文献

[1]Samal A.Iyengar P A.Automatic recognition and analysis of human faces and facial expres-sions:a survey[J]..Pattern Recognition, 1992, 25 (1) :65-77.

[2]Vapnik V N.The Nature of Statistical Learning Theory[M].New York:Springer-Ver-lag, 2000.

[3]Yang Jian, Zhang Avid.Two-Dimensional PCA:A New Approach to Appearance-based Face Representation and Recognition[J].IEEE Transaction on Pattern Analysis and Machine Intelligence, 2004, 26 (1) :131-137

[4]边肇祺、张学工, 模式识别[M].北京:清华大学出版社, 2000.

指纹图像预处理算法研究 篇8

在指纹采集的过程中, 由于手指本身的因素和采集条件等各种原因的影响, 采集到的原始指纹图像中往往包含有很多噪声, 造成指纹图像质量严重下降, 模糊不清造成脊线的粘连或断开, 会导致产生虚假的指纹细节特征;遗漏或忽略了正确的细节特征点;在有关描述细节特征点提取的有效性和可信性, 影响系统在匹配时的拒认率或误认率[1], 从而最终影响整个系统识别的结果。为了准确地进行细节点的提取和特征点的匹配, 图像就必须先经过预处理, 消除噪声、连接脊线断裂部分, 以得到纹线清晰的指纹图像。可以说, 预处理算法的好坏基本上决定了指纹识别系统的有效性和准确率。因此, 指纹图像增强在自动指纹识别系统中具有重要的地位和作用。

目前的指纹图像增强算法大都是利用指纹的方向特性和频率特性[2]来对图像进行滤波, 以达到图像增强的目的。但是在计算指纹图像的方向图和频率图时该类算法计算复杂。为此, 这里提出了利用Radon 变换来计算指纹图像的方向图, 然后利用方向滤波器来对指纹图像进行滤波的算法。实验结果表明, 该算法运行速度快、效果好, 为下一步的指纹识别奠定了坚实的基础。

1 Radon变换及其实现

设函数f (x, y) ∈L2 (D) 中, 在平面上D区域中它平方可积, 则f (x, y) 的Radon变换g (t, θ) 可表示如下:

g (t, θ) =Df (x, y) δ[t- (xcosθ+ysinθ) ]dxdy (1)

其中:δ是冲击函数, t- (xcos θ+ysin θ) =0表示极坐标下任意一条直线方程。

图像的Radon变换就是将原始图像变换为它在各个方向上的投影表示。图像f (x, y) 在任意角度θ上的投影定义为:

Rθ (x) =-f (xcosθ-ysinθ, xsinθ-ycosθ) dy (2)

其中:

[xy]=[cosθsinθ-sinθcosθ][xy] (3)

由投影切片定理知, Radon 变换与Fourier 变换有明确的对等关系。因此, 离散的Radon变换可以由Fourier变换来实现[3]。

2 算法原理

2.1 扩展像素值动态范围

对图像做局域动态范围扩展, 目的是消除图像因为采集按压力度不均匀而导致的局部灰度差别。在做过局域动态扩展之后, 连续纹线上的灰度变化难免会变大, 有必要做进一步的平滑[4]。

(1) 局域动态范围扩展:

使用一个滑动窗口遍历整个指纹图像, 按照式 (4) 计算并重置窗口内像素的灰度。

N (i, j) =F{[ (O (i, j) -m2) / (m1-m2) ]255} (4)

其中:N (i, j) 是窗口内处理之后的像素灰度值;O (i, j) 是处理之前的像素灰度值;m1和m2分别是窗口内灰度最大和最小的像素值; F 函数是用来取最接近结果的整数的函数。

(2) 平滑处理:

使用一个滑动窗口遍历整个指纹图像, 对纹线上的灰度进行平滑。若该窗口内的灰度变化小于预设阈值M, 则说明该窗口处于脊线或者谷线上, 使用中值滤波对其进行平滑;若灰度变化大于预设阈值M, 则说明该窗口处于脊线和谷线的分界线上, 不做任何操作。

2.2 计算方向场

首先对均衡化后的图像进行分块, 分块大小为8×8或16×16, 对每个图像块进行Radon变换, 并且假设在图像块内的指纹脊线在几何上具有互相平行的关系, 也就是该分块内的脊线具有相同的角度, 实验表明这种假设是合理的。又因为Radon变换就是将原始图像变换为它在各个方向上的投影表示, 所以在Radon域内, 最大值的点所在的列就对应于一定的脊线方向, 其关系如图1所示。图中脊线i表示图像块中的任意脊线, 它与x轴的交角为α, 此时第j条采样直线与脊线i垂直, 即在Radon域内最大值点所在的列为第j列。第j条采样直线与采样起始线的夹角为β, 采样直线从起始点开始沿顺时针方向旋转[5]。

由采样直线和图像平面的关系我们可以得出β的值, 然后根据图1所示的脊线与采样平面之间的关系, 可以计算出脊线的方向α为:

α=135°- (π/2n) × (j-1)

另外, 指纹图像在受到噪声的影响下会使得对指纹方向场的计算出现偏差, 这就需要进行进一步修正, 以消除噪声的影响。根据纹线具有缓变性的特点, 对求出的方向场进行平滑处理, 采用块操作的方法将相邻图像块的方向场变化控制在一定范围内, 从而低质量的指纹图像也可以获得较正确的方向场。

2.3 设计方向滤波器

指纹图像的重要特点就是纹线的方向性, 所以方向滤波是最有效的滤波方法。本文利用前面获取方向图, 采用OGorman等人设计的方向滤波器模板[6], 供不同的方向像素点选择。设计思想是使指纹纹线在切向平滑、在法向锐化, 以消除指纹图中纹线的断裂和叉连。方向滤波的关键就是滤波器的选择, 下面是涉及滤波器时的一些注意事项:

(1) 在设计滤波器模板的模板时, 模板尺寸的选择要合适。要求大小为一个或者一个半的纹线周期, 并且为奇数, 这样模板就可以通过中心点关于x轴和y轴对称。

(2) 为了提高脊线和谷线的灰度方差, 达到边缘锐化的效果, 在垂直于纹线方向上中央部分系数为正, 两边系数为负, 因此滤波器模板中所有系数的代数和应为零。

(3) 方向滤波器是由平均滤波器和分离滤波器组合而成的。平均滤波器主要是连接脊线中出现的断裂, 分离滤波器主要除去图像中的叉连。平均滤波器的系数满足A>B>C>D>0, 分离滤波器的系数应满足A+2B+2C+2D=0。一个基本的方向滤波器 (如图2所示) 应该同时具备两种功能, 它相当于平均滤波器加上分离滤波器, 所以它的系数是平均滤波器和分离滤波器的系数之和[7]。

(4) 水平方向滤波器的模板示意图 (如图2) 所示。以n=7为例, 其他方向的滤波器模板可以通过旋转得到。滤波器模板大小为n×n, n由指纹图像中脊线和谷线的宽度以及实验条件决定, 边宽一般是3~10个像素。

(5) 由于指纹是具有方向性和谷脊交替性的特殊图像, 所以要根据像素点方向不同而采用不同的方向滤波模板。

这样在选取滤波模板以后, 就对图像进行滤波, 将整个图像分成w×w的小块, 根据上面计算得到的低频指纹方向图判断每一小块的方向, 采用相对应的滤波模板进行滤波。

3 实验结果

实验基于Intel P4 3.0 GHz的PC机, Window XP操作系统, Matlab 6.5的仿真软件环境下。指纹库采集分辨率为500 dpi, 指纹采集设备为PIS2004光学指纹采集仪, 图像尺寸大小为640×480。该算法是针对指纹库中模糊的低质量指纹提出来的, 为了验证本算法, 从采集到的指纹库选取了每个指纹的1幅低质量指纹图像样本组成一个110幅图像的样本库, 用于验证本文方法的效果。在该实验条件下, 经过反复验证, 图像分块的大小以w=8最为合适, 滤波器的宽度以n=7效果最佳, 系数以A=-5, B=1, C=3, D=3效果最佳。部分实验结果如图3所示。

由图3中的对比可以看出:原始指纹图像的纹理不够清晰, 亮度也不均匀;经过滤波处理之后, 图像脊线和谷线分界清晰, 且亮度均匀, 大致体现了原指纹图像的真实纹线结构。

4 结 语

提出基于Radon变换的指纹图像预处理算法, 从指纹图像的纹理性出发, 利用Radon变换获得图像的方向场, 然后进行方向滤波, 从而实现了连接断开的脊线, 使脊线和谷线得到分离, 从而获得较好的增强效果且算法简单, 运行速度快, 利于硬件实现。处理后的图像可以直接用于特征点匹配, 并且可以推广到一般的纹理图像, 但是该算法在处理更加复杂的纹理图像时增强效果并不理想, 如何扩大该算法的适应性还有待于进一步研究。

参考文献

[1]Sherlock D.Momro D M, Millard K.Fingerprint Enhance-ment by Directional Fourier Filter[J].IEEE Proceedings ofVision Image and Signal Processing, 1994, 141 (2) :87-94.

[2]Li Jun, Wang Han.Const Rained Nonlinear Models ofFinger print Orientations with Prediction[J].PatternRecognition, 2006, 39:102-114.

[3]史延新.一种利用Radon变换的指纹图像预处理算法[J].西安工业大学学报, 2007, 27 (5) :468-470.

[4]Josef Strom Bartunek, Mikael Nilsson, Jorgen Nordberg.Adaptive Fingerprint Binarization by Frequency Domain[J].Analysis, Signals, Systems and Computers, FortiethAsilomar Conference on, 2006:598-602.

[5]Bazen A M, Gerez S H.Systematic Methods for the Compu-tation of the Directional Fields and Singular Points ofFingerprint[J].Pattern Analysis and Machine Intelligence, IEEE Transactions on, 2002, 24 (7) :905-919.

[6]O′Goman L, Nickersion J V.An Approach to FingerprintFilter Design[J].Pattern Recognition, 1989, 22 (1) :29-38.

图像处理算法 篇9

1.1 数字图像处理原理简介

图像处理技术是本世纪信息科学方面成长最迅速的方向之一, 数字图像处理的技术具有实际的研究价值。数字图像处理技术是指利用图像信号转化为数字信号并进行数字化处理这一手段把输入图像转换成具有所希望特征的另一幅图像的过程, 通过转化, 使得图像的信息数字化, 可计算化, 协调适应现在的各种数字化系统。近年来, 随着图像传感器趋于高集成度和低成本以及数字硬件的迅速发展, 高质量、高速度、高实时性的数字图像处理技术越来越受到欢迎。专用集成电路ASIC和数字信号处理器DSP, 在两种方面突破研究, 一是改变图像处理算法, 简化算法提高处理速度;二是改变实现算法的手段。DSP处理速度较之前的数字芯片有了大幅改进, 但其体系仍是串行指令系统, 其固定算法仍不能满足众多算法的需要。

1.2 现场可编程门阵列 (FPGA) 器件技术

现在较为流行的一种半定制的数字芯片是现场可编程门阵列 (FPGA) 器件, 它是一种高密度可编程逻辑器件, 由大量逻辑宏单元构成, 通过各种程序参数的配置, 能够发挥这些逻辑单元的各自效果, 组合出期望的整体效果和功能, 这些配置数据存放在片内的SRAM中或者是片外的EPROM或其他存储体中, 设计者可以现场修改器件的逻辑顺序, 而且静态编程和动态系统重置功能也得到了充分的发挥也应用, 基于组合逻辑下的功能让硬件模块可以像软件代码一样方便修改调试。

2 基于FPGA的数字图像处理算法研究

2.1 实时图像处理算法

实时图像处理系统和图像处理的主要算法有4类:图像数据的预处理, 图像智能识别, 对象检测和运动对象检测。在实时图像处理系统的后台处理中, 比分析环境简单、静态图像难度要更具有复杂性, 如在数字图像信号的传送过程, 中间过程传感器和传输信道的噪声的频繁产生, 这让暂未得到处理的原始图像信号变的更为难以分析, 而且本身存在一定程度的噪声。一般图像信号的锐化技术处理也将引入噪声, 有时会加强原始图像的噪声。因此, 有必要在图像分析处理以前以及过程中对图像的噪声进行滤除, 并对图像特征进行加强, 消除噪声和增强图像这两大关键步骤即为数字信号图像的预处理过程。

2.2 图像空域平滑算法

图像平滑处理的的主要目的是为了降低噪音干扰, 目前主流的两种算法是的空间域平均算法以及中值滤波算法。对于含有噪声的原始图像的每个像素都采取了对应的邻域, 将计算出的平均值作为平均空间域中图像像素值进行图像处理。空间域平均算法对于高斯噪声消噪效果较好, 但处理脉冲噪声降噪效果很差。中值滤波的实质是一种非线性处理方法, 主要的原理应用了顺序统计思路, 这种方法的原理是在第一步骤中赋予一个像素作为邻域的中心, 选择方形邻域后, 第二步骤就是对范围内各像素灰度值进行排序处理, 排序之后获得数列的中间值, 此中间修正值被记为中心像素的灰度值, 在实际应用中个, 中值滤波算法消除脉冲噪声具有更好的效果。

2.3 图像空域锐化算法

图像锐化的主要目的是使原图像轮廓模糊或者显示边缘不明显的变得清晰, 突出细节。进行锐化处理的前提基础是:原始图像必须具有有较高的信噪比, 若没有较高信噪比, 经过图像锐化处理后, 图像信噪比会大大降低, 这非常不利于图像的清晰显示处理。通常的做法是先去除或降低噪声, 使得图像具有更高的信噪比后, 再进行后期的锐化处理。

图像锐化处理目前主流有两种方法:高通滤波法和微分法。微分法属于图像空域锐化, 目前常用的两种方法是梯度锐化和拉普拉斯锐化。

2.3.1 梯度锐化

梯度锐化原则:图像变化速度值小的对应于一个较小的梯度, 整体会显得比较暗。因此, 梯度锐化的常规思路是利用门限方法来判定, 从而进行梯度锐化优化, 也就是先赋予一个预定的阈值, 如果该节点的梯度小于阈值时, 原始灰度被保持恒定;若大于阈值时, 在这一点上的灰度校正值可以用微分法处理得到。

2.3.2 拉普拉斯运算

拉普拉斯运算是偏导数运算的线性组合, 拉普拉斯算子是一种各向同性的微分算子, 其特性包括旋转不变性。拉普拉斯运算完全可以转换成模板运算, 而且对图像中的孤立点和短点反应较为敏感, 比如在较暗的图像中出现的个别亮点, 这些亮点处灰度发生跳变, 通过拉普拉斯运算将会使这些亮点亮度增强, 这一效果常用于边缘检测。当然, 拉普拉斯运算同梯度锐化一样, 在增强图像的同时会增强噪声, 因此在锐化前可以先进行图像平滑处理。

3 总结

本文以基于FPGA的高速图像处理算法为研究主体, 对图像处理中技术的流水线实现、图像空域平滑算法、图像空域锐化算法进行对比分析。图像平滑算法减少噪声的效果要更加优化, 平滑算法的中值滤波算法在消除脉冲噪声中效果更为突出。空间域平均算法主要对高斯噪声的消噪效果较好, 对脉冲噪声消噪效果一般。图像空域锐化算法可以是原本边缘模糊的图像清晰化, 前提需要有较高信噪比, 所以一般是先进行去除噪声, 提高信噪比之后进行锐化处理, 锐化算法中的梯度锐化、拉普拉斯运算算法都在基于FPGA的数字图像处理的系统算法中效果明显。

摘要:近年来, 图像处理的信息量越来越大, 原先的传统图像处理技术已不能满足速度、质量等方面的需求, 为了应对这种情况, 利用基于FPGA技术的图像处理系统, 可以提高处理速度, 提高效率、质量。本文先简单介绍了数字图像处理技术的发展, 包括从基于通用计算机的软件处理发展到专用集成电路 (ASIC) , 基于模拟信号转换成数字信号的专用处理器, 以及现在流行的可编程门阵列 (FPGA) , 然后研究了基于FPGA可实现的基本的数字图像处理算法以及动态视频图像处理算法。

关键词:FPGA,图像处理,实时高速,平滑算法

参考文献

[1]李冬.基于FPGA的数字图像处理的研究[D].安徽理工大学硕士学位论文, 2009.

图像处理算法 篇10

近些年来,随着数字图像处理技术、智能控制技术及计算机模式识别技术等的快速发展,视频火灾检测技术应运而生。此技术的出现,为上述问题的解决提供了新的方向。该项技术不仅具有响应时间快、监测范围广、非接触、抗干扰、智能化等技术优势,还能为监控人员实时提供火灾所发生的地点、火情发展程度等具体信息,给救援人员赢得了宝贵时间,从而使火灾所造成的损失降到最小,因此成为火灾探测领域研究的热点。

1 视频火灾探测技术的基本原理

视频火灾检测技术的基本原理如图1所示。该项技术使用普通的CCD摄像机或造价高昂的红外摄像机来进行场景的监控,进而获取视频图像。经图像采集卡将拍摄到的视频图像转变为相应的数字图像,并传送到监控系统的主机,等待下一步的处理与分析。系统主机通过对提供的数字图像进行分析、判断,且结合多种火焰或烟雾特征判据,从而做出有无火灾出现的结论。

2 视频烟雾检测算法的发展现状

目前,国内外对于视频烟雾检测算法的研究虽然尚处于起步阶段,但仍取得了一定的成果。Toreyin等人利用背景减除法、小波变换等方法来提取烟雾的边缘、纹理、运动等有效特征,以此来判断视频中是否存在烟雾。Kopilovic等人提出可以利用烟雾具有不规则运动这一特征,并运用光流法对疑似烟雾区域进行分析、判断。袁非牛等人提出了一种通过分析烟雾的累积量和主运动方向的方法,以确定图像中是否存在烟雾。

笔者在对已有的视频火灾烟雾检测算法进行分析和总结的基础上,提出了改进的烟雾检测算法,算法的主要实现过程如下:一是运用基于混合高斯模型的背景差分法实现对运动目标区域的检测;二是利用烟雾的多种图像特征对目标区域进行分析与判断;三是依据烟雾特征判据结果,确定测试视频中是否含有烟雾区域。

3 运动目标区域的检测

3.1 运动目标检测方法的确定

运动目标检测作为烟雾检测算法的首要构成部分,其检测效果将直接关系到后续能否正确识别出图像序列中的烟雾区域,而帧间差分法、光流法和背景差分法这三种方法是目前比较常用的运动目标检测方法。

通过对上述三种检测方法的利弊进行对比与分析,确定使用背景差分法实现运动目标区域的检测。但该方法需对背景图像进行实时建模与更新,而混合高斯背景建模法能够在多种复杂、混乱的环境中构建背景图像模型。因此,为了满足算法的整体需求,选择采用混合高斯模型的方法先对背景建立模型,背景建模完成后,再运用背景差分法提取出运动目标区域。

3.2 运动目标区域检测效果

笔者运用基于混合高斯模型的背景差分法得到的运动目标区域检测效果图,如图2所示。其中,测试图像中所包含的场景分别为:正常行走的路人、多辆正在行驶的车辆。从效果图中可以看出,此方法能够准确检测出目标区域的位置,且提取出的目标轮廓较为完整、清晰。

4 烟雾静态特征与动态特征的提取与分析

将运动目标从背景图像中分割出来后,分析和判断该运动目标区域中是否存在烟雾将是后续的研究重点。

4.1 烟雾静态特征

烟雾的静态特征主要是指在视频序列的某一帧静止图像中,烟雾所表现出来的若干图像特征,一般包括烟雾的颜色特征和凸形度特征。

4.1.1 烟雾的颜色特征

当火灾发生时,所产生烟雾的颜色通常可以分为白色、灰色、青色、黑色。经过研究后发现,白烟、灰烟和黑烟的RGB颜色模型中的红色、绿色、蓝色三个颜色分量的值很近似,而青烟的蓝色分量值通常要大于红色和绿色的颜色分量值。因此,笔者采用以下判别算法来判断测试图像中是否存在满足烟雾颜色条件的疑烟区域,以排除掉一些与烟雾颜色相差很大的非烟雾区域。具体算法如式(1)所示。

条件1:|Pmax-Pmin|<Z1

条件2:Z2<I<Z3

条件3:Pmax=B AND |Pmax-Pmin|<Z4

式中:Pmax为在RGB彩色空间中最大的颜色分量,相应的Pmin为最小的颜色分量;I为在HSI彩色空间中的强度信息。

若条件1和条件2同时成立或条件2和条件3同时成立时,则视为满足烟雾颜色的条件,已检测出的运动目标区域就可以确定为疑似烟雾区域;反之,则视为非烟雾区域。在条件1中,阈值Z1的取值范围为15~25;在条件2中,阈值Z2和Z3的取值分别为80、220;在条件3中,阈值Z4取值应略大于Z1。

4.1.2 烟雾的凸形特征

烟雾一般会受到外界环境(温度、湿度等)的影响而连续地对外膨胀,因其内部大气压力要远大于外部压力,故烟雾图像会明显表现出凸形特性。

通常在边缘长度相等的所有封闭平面曲线中,以圆形所围成的面积是最大的。所以,可以通过运用疑烟区域面积和与之相等边缘长度的圆的面积之比来检测目标区域的凸形特征,具体算法如式(2)所示。

式中:s1、s2分别为疑烟区域面积的像素总数和与之同周长圆的面积的像素总数;L为疑烟区域周长的像素总数;T1、T2为满足烟雾凸形特征的两个阈值,试验后得出其值分别为0.04、0.2。若s1与s2的比值k在区间(T1,T2)范围内时,则经过烟雾颜色特征判别后的疑烟区域就视为满足烟雾的凸形特征,并进行下一步的判别;反之,则视为非烟雾区域。

4.2 烟雾动态特征

烟雾的动态特征是指在连续的视频帧图像中,烟雾所表现出的一些特有图像特征,其中包括烟雾的形状不规则性特征和运动扩散性特征。

4.2.1 烟雾形状的不规则性特征

由于气流的因素,导致烟雾在扩散过程中其形状会连续发生变化,此为烟雾的形状不规则特征。通常两个物体在面积相等的条件下,形状规则物体的周长会比形状不规则物体的周长要短一些。可以通过运用疑烟区域的周长和面积之比来检测其形状的不规则性,具体算法如式(3)所示。

式中:ASEP、ASTP分别为提取出来的疑烟区域的周长与面积的像素总数;ASTD为区分烟雾与形状规则物体的临界阈值,经过多次测试后得出其值为0.5。若式(3)成立,则满足烟雾静态特征判据的疑烟区域更加接近于烟雾区域;反之,则视为不满足烟雾形状不规则特征,停止下一步对疑烟区域的判别。

4.2.2 烟雾运动的扩散性特征

在火灾形成初期,由于烟雾运动的扩散性特征,使得烟雾在短时间内占据了大量的空间,此现象在视频图像中表现得尤为明显。因此,疑烟区域在经过烟雾的静态特征和形状不规则性特征分析后,可以运用烟雾的扩散性特征对疑烟区域中是否存在烟雾区域做出最后的判断。具体算法如式(4)所示,计算出在某一时间段内疑烟区域面积的变化率,以判别其是否满足烟雾的扩散性这一运动特征。

式中:Ri+m和Ri分别为在图像序列中的第(i+m)帧图像和第i帧图像疑烟区域总的像素个数;ΔYdi为从图像序列中的第i帧到第(i+m)帧这一时间段内,疑烟区域像素总数发生改变的变化率。m的取值通常要大于1。

为了获得更为准确的疑烟区域面积发生改变的变化率,可以对n个不同的面积变化率 ΔYdi取平均值,以得到疑似烟雾区域面积的平均变化率,如式(5)所示。

烟雾区域面积的平均变化率往往在一定的区间范围内,若疑烟区域面积的平均变化率满足式(6),则该疑烟区域就可以确定为烟雾区域;反之,则视为非烟雾区域。

式中:E1和E2分别为烟雾区域面积平均变化率所在区间的两个阈值。

5 测试结果与分析

目前,国内外研究学者虽然提出了多种不同类别的视频火灾烟雾检测算法,但是对于各种算法性能指标(探测率、实时率、误报率、时间和空间消耗等)的评价尚未形成一个标准的体系。而且,由于缺少统一标准的火灾烟雾测试图像资源,试验中所用到的图像样本多数是个人拍摄获取或是直接从网络上下载得到的。

为了验证笔者所述视频火灾烟雾检测算法的可靠性和准确性,分别以室内和室外环境中的多个视频图像作为测试样本来进行试验研究。这些图像样本中既包含烟雾图像,也包含一些非烟雾图像。以下是部分图像样本的场景描述信息和烟雾检测结果,分别如表1、表2所示。

分析结果发现,笔者的烟雾检测算法拥有较高的识别率和较低的误报率、漏报率。但当测试图像中出现一些与烟雾颜色、形状等特征极其相似的非烟雾目标对象时,检测结果会出现少量的误报。部分图像样本的烟雾检测效果图和非烟雾检测效果图,分别如图3、图4所示。

从图3、图4能够看出,此算法能够在含有烟雾的图像样本中,识别出大部分的烟雾区域;在不含有烟雾的图像样本中,排除掉多数的非烟雾目标对象。

6 结束语

笔者在运用基于混合高斯模型的背景差分法来提取出运动目标区域的基础上,利用火灾烟雾所表现出的特有静态特征和动态特征,对运动目标区域进行分析与判断,并将符合烟雾图像特征判据的目标区域划分为烟雾区域。测试结果证明,该算法能够在开阔的室内场所以及大面积的室外环境中应用,为及时探明火情,并有效控制火情的发展提供有力保障。

此烟雾检测算法虽然在一定程度上取得了良好的检测效果,但在算法当中仍存在一些不足,对测试图像样本中一些场景信息的烟雾检测偶尔会出现一定数量的误报和漏报。在今后的研究和工作中,需要对现有的算法进行改进,将其他更多、更为有效的烟雾图像特征判据加入到算法中,并运用图像分类的方法对烟雾的特征进行融合判断,最终得出图像中是否存在烟雾区域的结论,以此来进一步提高视频烟雾检测算法的准确率。

摘要:在综述视频火灾探测技术的基本原理和现有视频火灾烟雾检测算法的基础上,提出了一种结合烟雾静态特征与动态特征进行研究的视频火灾烟雾检测算法。介绍运动区域目标检测与提取方法及效果,以及烟雾静态特征和动态特征的提取和分析。测试结果证明该算法能够准确且迅速地探测出火灾烟雾,误报率低,可靠性好。

关键词:烟雾,静态特征,动态特征,火灾探测算法

参考文献

[1]孙宇臣,王自朝,葛宝臻.视频火灾探测系统现状分析[J].消防科学与技术,2007,26(4):414-417.

[2]薄立矗.图像型火灾烟雾探测技术及发展前景展望[J].武警学院学报,2010,26(8):14-16.

[3]Toreyin B U,Dedeoglu Y,Cetin A E.Wavel-et based real-time smoke detection in video[C]//Proceedings of European Signal Processing Conference,Antalya,Turkey,2005.

[4]Kopilovic I,Vagvolgyi B,Sziranyi T,Applica-tion of panoramic annular lens for motion an-alysis tasks:surveillance and smoke detection[C]//Proceedings of International Conference on Pattern Recognition.Barcelona,Spain,2000.

[5]袁非牛,张永明,刘士兴,等.基于累积量和主运动方向的视频烟雾检测方法[J].中国图像图形学报,2008,13(4):808-813.

[6]魏晓慧,李良福,钱钧.基于混合高斯模型的运动目标检测方法研究[J].应用光学,2010,31(4):574-578.

[7]许峰,于春雨,徐放.视频烟雾火灾探测技术研究趋势[J].消防科学与技术,2012,31(11):1185-1188.

[8]王媛彬.基于图像型的火灾烟雾检测技术研究[J].消防科学与技术,2014,33(9):1052-1055.

雷达数据处理算法的仿真研究 篇11

关键词:雷达;数据处理;跟踪滤波;仿真

雷达数据处理包括了很广泛的内容,本文指雷达目标的数据处理,主要是对用雷达方法取得的目标位置及运动参数进行滤波,平滑,预测和微分等运算。相控阵雷达系统的数据处理完成的基本流程包括:建立目标航迹,并进行航迹管理;检测点迹与航迹的配对,即航迹关联;目标的跟踪滤波及预测[5]。本文重对航迹关联算法和跟踪滤波算法进行了研究,并给出了仿真结果。

1 相控阵雷达数据处理系统的工作模式和处理流程

相控阵雷达主要工作状态可分为搜索状态和跟踪状态。雷达处于搜索状态时测量精度较差,而测距精度相对来说较高,因此此时只在距离维上进行数据处理;而处于跟踪状态时,测距精度和测角精度都较高,因此可以从三维空间上进行更为复杂的航迹关联。本文仿真的情况为雷达已经工作在跟踪状态下,以跟踪状态的数据处理为重点。数据处理系统主要完成目标航迹的起始、终止、数据关联、跟踪滤波、下一点空间位置的预测等工作。

由于可能面临多个目标,所以新发现的点迹必须与已经跟踪上的航迹进行关联配对,当配对实现后,利用跟踪滤波更新航迹信息,以产生精确的目标位置和速度估计值,同时形成下一时刻目标位置的预测波门。如果存在没有与任何航迹关联上的点迹,则用这些点迹生成新的航迹;如果已有的目标航迹多次没有任何点迹与之关联,则此航迹终止[1]。

综合后的雷达事件数据处理流程如图1所示[3]。

2 数据处理的基本算法

数据处理的基本算法包括数据关联、航迹管理、目标跟踪算法等。本文重点讨论数据关联算法和跟踪滤波算法。

2.1 数据关联

数据关联主要是解决多目标跟踪中雷达预测数据(点迹)与目标(航迹)的配对问题,当配对实现之后,航迹信息可被更新,以产生精确的目标估计值。常采用的方法有最近邻域法、概率数据关联法和联合概率数据关联法,本文采用最近邻域法。

最近邻域法的实质就是检测点迹与航迹的空间统计距离,选择使“空间统计距离”最小的检测点迹作为目标航迹的配对点迹。所以,计算检测点迹与航迹之间的空间统计距离是最近邻域法的关键。下面讨论空间统计距离的算法。

雷达测量是在球坐标中进行的,目标的状态方程是在直角坐标系中建立的,在球坐标系中用r、θ和φ表示距离,方位角和俯仰角。则球坐标系和直角坐标系之间的变换关系为

r=■(1)

θ=arctan(■)(2)

φ=arctan(■)(3)

雷达观测矢量为Z(k)=[r(k)■(k)θ(k)φ(k)],其中■(k)表示目标的径向速度。检测点迹为z(k),航迹i的预测值为■(k/k—1),则可得检测点迹的空间统计距离为

ρ=■(4)

按(4)式分别算出检测点迹与航迹的空间统计距离,其中空间统计距离最小的点迹与航迹配对,用该点迹的观测数据进行航迹的滤波处理。

在进行滤波前,首先确定一个波门,然后以航迹预测值为中心,寻找波门内的点迹集合,对点迹集合中的点迹进行数据关联。若波门内没有点迹,则将波门扩大3~5倍,重新进行数据关联,若仍然无点迹存在,则使用预测值代替这一时刻估计值,并对下一时刻进行滤波处理。若外推5点后,波门内仍无点迹,则认为该航迹消失。

2.2 跟踪滤波算法

目标跟踪滤波算法采用计算量较小的α—β滤波。由于雷达距离和方位角测量误差的不相关性,故滤波可在极坐标系的两个坐标轴上独立进行[4]。

α—β滤波的目标运动模型为

s(k+1)=s(k)+[■(k)+w(k)]T(5)

■(k+1)=■(k)+w(k)T(6)

其中,s(k)可以表示r(k)、θ(k)或者φ(k),分别为k时刻目标的距离、俯仰角和方位角,相应的,■(k)可以表示■(k)、■(k)和■(k),分别为目标的径向速度、方位角速度和俯仰角速度。w(k)是目标速度的扰动噪声,取均值为零的高斯白噪声,T表示一个雷达扫描周期或者相关处理间隔。

雷达观测方程为

z(k)=s(k)+ns(k)(7)

其中,ns(k)可以表示nr(k)、nθ(k)或者nφ(k),分别表示雷达距离、方位角和俯仰角的测量噪声,取均值为零、均方差分别为σr、σθ和σφ的高斯白噪声。

滤波算法启动方式分为两点启动和三点启动,本文建立的模型是匀速(CV)模型,故采用两点启动。设前两个点的观测数据为z(k)=[r(k)θ(k)φ(k)]T,其中k=1,2,则航迹启动前两个时刻的距离估计值分别为r(1)、r(2),方位角估计值分别为θ(1)、θ(2),俯仰角估计值分别为φ(1)、φ(2);航迹起始状态径向速度、方位角速度和俯仰角速度的估计值分别为

■ (k/k)=■(8)

■(k/k)=■(9)

■(k/k)=■(10)

下面给出滤波方程,其中■(k/k)、■(k/k)表示当前位置的滤波估计值,■(k+1/k)、■(k+1/k)表示下一时刻的预测值,■(k+1/k+1)、■(k+1/k+1)表示下一时刻的滤波估计值。

■(k+1/k)=■(k/k)+■(k/k)T(11)

■(k+1/k)=■(k/k)(12)

■(k+1/k+1)=■(k+1/k)+?琢(k+1)■(k+1)(13)

■(k+1/k+1)=■(k+1/k)+?茁(k+1)■(k+1)(14)

其中,■(k+1)为新息

■(k+1)=z(k+1)—■(k+1/k)

?琢(k+1)可以表示径向距离增益或径向速度增益,?茁(k+1)可以表示角度位置增益或角速度增益,他们之间的关系为:

nlc202309010105

?琢(k+1)=

■■

(16)

?茁(k+1)=■2[2—α(k+1)]—4■

(17)

其中q(k+1)为信噪比,此参数定义为

q(k+1)=■■(18)

其中σs可以表示σr、σθ或者σφ,分别为距离测量均方差、方位角测量均方差和俯仰角测量均方差。■(k+1)表示新息,反映了测量误差,设新息有N个抽样值,其方差为σz2(k+1),本文仿真中,取N=3。根据抽样统计知识

σz2(k+1)=■■■■(k+1—i),N=3(19)

式子(15)~(19)为α和β提供了自适应获取方法。

3 仿真结果分析

设定一个简单的场景,用几何关系算出目标的径向距离、方位角和俯仰角理论值,再用上述跟踪滤波算法算出各时刻预测值,从而求出理论值和预测值的差值,误差的大小用以检测滤波器内部算法的正确性。

本文仿真场景和参数为:在直角坐标系中,目标以500 m/s的速度做匀速直线运动,在10 s时开始机动,机动方式为向上爬升,机动时水平速度降为200 m/s,向上爬升的速度为100 m/s。雷达位于目标正后方,即方位角始终为0,且雷达扫描周期T=0.01 s,距离测量均方差σr=10m,俯仰角测量均方差σφ=0.0578°,由于本文设置的场景下方位角始终为零,故只考虑俯仰角。

由图2和图3可以看出,滤波启动后有一个暂态过程,距离误差和角度误差很大,稳定后,误差逐渐减小直至趋近于零。10 s时,由于目标开始机动,此时误差再次变大,稳定后又误差又减小,趋近于零。所以,本文建立的滤波器模型对目标具有良好的跟踪性能,能准确预测目标下一时刻的径向距离和俯仰角,从而精确的预测目标在空域中的坐标。

4 结束语

本文基于雷达数据处理仿真的要求,建立了数据处理系统的模型,并对其中的关键算法进行了研究,给出的结果证实了此模型可以有效的跟踪目标,稳态时距离预测误差不超过2m,角度预测误差不超过0.05°,达到了准确预测目标空间位置的目的。

参考文献

[1] 毛滔,李盾,王雪松. 相控阵雷达数据处理仿真研究,航天电子对抗[J],2004,(4).

[2] 陈明燕,张伟,汪学刚. 相控阵雷达数据处理系统的仿真,电讯技术[J],2008,4.

[3] 刘宇. 雷达数据处理中的航迹相关[D],四川:四川大学硕士学位论文,2003.

[4] 高爱丽. PD雷达数据处理系统仿真研究[D],四川:电子科技大学硕士学位论文,2003.

[5] 王雪松,肖顺平,冯德军,赵锋等. 现代雷达电子战系统建模与仿真,电子工业出版社,2010,223—251.

[6] D.J. Wilkin,I. Harrison,M.S. Woolfson. Target tracking algorithms for phased array radar[J]. IEEE Proceedings—F,1991,138(3): 255—262.

基于数学形态学的图像处理算法 篇12

图像分割是指用区域对图像所进行的分割。这些区域的总和应覆盖整个图象, 而彼此互不重叠, 分割后的图像应具有相同的特性, 这些特性可以是形状、颜色、纹理、灰度等任何一个。在图像处理中, 图像分割时一个关键的步骤。因为在图像的研究过程中, 大家一般只对某些其中的部分感兴趣。为了更好的识别与分析目标, 往往要把这部分区域分割出来, 再对分割出来的目标作深层次的分析, 对目标进行特征的提取、参数识别和测量, 能更好的促进下一层级的图像理解和分析。

成像技术可以用来泛指所有与图像相关技术, 这些技术数量巨大, 我们可以把它们放到图像工程范畴里。图像工程分为理解、分析、处理三个层级, 且会研究所有涉及到图像的领域。图像处理是为了优化视觉效果, 分析是为了检测图像里我们所需要的信息。图像分割是一种重要的图像处理技术, 在实际的应用和理论研究中已经受到了人们的广泛重视, 在不同的研究领域图像分割有不同的名称, 如目标检测技术, 阈值化技术, 图像区分或求差技术, 目标识别技术, 目标轮廓技术, 目标跟踪技术等。

2 分水岭图像分割过程

我们将图像分割的过程描述如下:首先, 设想存在一个二维图像, 并认为它是一个三维地形表面, 且有一系列的低谷存在于该三维地形表面, 二维图像的表面像素点或最小值对应地形表面连接区的底部。假设我们将这些极小值刺穿, 将该三维地形表面逐渐浸至湖水中, 在上述过程中, 由于在湖内存在水压, 将会有水从被刺穿的洞中涌出, 这个涌出过程直至涌出的水与湖水高度相同才停止, 停止时水面已经完全将该三维地形表面浸没。然而在整个过程中, 不同的洞中将会涌出水并最终汇集于某一点。为了避免涌入的水汇集于某一点, 我们尝试提高该点的像素值。当三维地形表面浸至湖中的高度愈深, 我们所需要提高像素值的点就愈多, 这些被提高的点将会最终集合形成为一条竖直的线即水坝。在该三维地形表面被不断浸至湖中期间, 为了避免从各个洞中涌入水汇集, 我们不断设立水坝。若三维地形表面全部浸至湖中, 将能看到湖水被分割成若干个单独的水坝区域。

在上述的过程中, 我们采用湖水作为参照系。若我们变更参照系, 采用三维地形表面作为参照系。以三维地形表面作为参照系时, 我们认为三维地形表面不动, 湖水水平面处于匀速上升状态, 逐渐浸没整个地形表面。在浸没地形表面的过程中, 那些较为低洼的部分即图像谷底最先出现积水现象。伴随水平面不断上升, 出现积水现象的面积逐渐增大。为了避免各个山谷中积水连接到一起, 需要在连接处设立水坝。在整个三维地形表面全部被湖水浸没后, 我们将会发现湖水被水坝分割成若干个区域。上述漫水过程即分水岭图像分割过程。

在图像分割过程中, 分水岭算法就是将图像视为测地学中的拓扑地貌。该算法属于某种基于拓扑理论中数学形态学分割算法。某点的海拔高度采用图像中一个像素的灰度值来代表。集水盆也就是任何极小值和会被该值影响到的区域, 分水岭即为集水盆与集水盆之间的界限。该算法将梯度图像中像素值 (水位) 按升序进行处理。采用分水岭分割算法时, 将会把图像分割成若干个区域, 每个区域都和一个极小值点一一对应。

3 分水岭算法的具体实现

分水岭算法实质上属于某种区域增长算法, 该算法借鉴了地形学中的概念, 与之不同的是, 分水岭算法从图像中极小值开始增长。受暗纹理细节和暗噪声的影响, 可能有大量伪极小值存在于图像中, 而上述伪极小值可能会在图像中生成对应的伪积水盆。因此, 假如分水岭算法无法有效的将上述真、伪极而是小值区分开, 协同作为同一单独区域分割, 那么在最后将有可能产生分水岭较为严重的过分割问题。

当前用来克服过分割有以下两类主流的方法:一、先平滑处理再分水岭变换, 以期较少由噪声产生的过分割;二、在对小区域进行合并前分水岭变换, 将相邻的区域合并。其中方法一较为有效的减少了图像中的细纹和噪声, 但相应的降低了分割精确度, 造成了边界模糊的新问题;方法二在将区域合并的过程中, 需要大量的内存不停地释放、分配, 造成了耗时长、计算量大的新问题。

在进行图像分割时使用传统分水岭分割算法, 有可能出现为了保护物体边缘信息的需求与简化图像的需求之间的矛盾。大多数分水岭算法都是对已简化的图像进行处理, 所以我们要在简化图像时就考虑到物体边缘信息丢失的问题。出于保护图像的边缘信息的考虑, 我们可能无法有效地去除图像中的全部噪声, 这会导致可能有大量的伪极小值点存在于造成简化后的图像中。当我们分割简化后的图像时, 可能会造成较为严重的过分割后果。为了减少上述的过分割后果, 我们需要考虑与其它算法结合。假设采用基于标记的分水岭算法把被提取出来的标记当做被图像局部极小值, 在被处理的梯度图像上采取分水岭有可能获得较好结果, 这种基于标记的算法要点在于能够找到被分割图像中的物体的区域极大值点。由于分水岭算法是在被标记修改后的极小值原始梯度图像上所进行的, 因此能够保证分水岭分割图像边缘信息未受到影响。

我们采用分水岭来表示被输入图像的极大值点, 也就是集水盆间的临界点, 这个点通常通过分水岭变换获得。所以一般采用输入梯度图像, 用以获得图像的边缘信息。

式中, f (x, y) 表示原始图像, grad (·) 表示梯度运算, 分水岭算法进行图像处理时, 物体表面极其微小的灰度变化与图像中的噪声都有可能造成图像的过分割, 这是由于对微弱边缘分水岭能够产生理想的反应, 分水岭对弱边缘的上述理想的反应确保了将会得到连续、封闭的边缘。分析图像区域特征往往需要该算法所得到的封闭集水盆。我们大多数情况下可以采用下述处理方法以减弱分水岭算法可能导致的过分割:

(1) 对梯度函数进行修改使集水盆仅仅响应预期的目标;

(2) 依靠已知的情况减少无关的边缘信息。

减少分水岭算法导致的过度分割往往需要修改梯度函数, 而对该图像进行阈值变换往往是是简单有效的方法, 该方法能消除灰度的微小变化产生的过度分割。

式中, gθ 表示阈值, 而阈值的选取优劣直接绝对了分割结果是否令人满意, 因此选择更好的阈值往往是更好的进行图像分割的关键。

参考文献

[1]Vincent L, Soille P.Watersheds in digital spaces:An efficient algorithm based on immersion simulations[J].Trans.Pattern analysis and Machine Intelligence, 1991, 13 (6) :583-598.

[2]Zhang Y J, GerbrandsJJ.Objective and quantitative segmentation evaluation and comparison.Signal Processing, 1994, 39:43-54.

[3]Serra J.Image.Analysis and Mathematical Morphology.Academic Press, London, 1988.

[4]Matheron G.Random Setsand Integral Geometry.New York:Wiley, 1975.

[5]Serra J.Image Analysis and Mathematical Morphology.New York:Academic, 1982.

[6]姚敏.数字图像处理[M].北京:机械出版社, 2006, 110-117.

[7]马东, 曹培杰, 潘凯丽.分割重叠细胞核的方法及比较研究[J].北京生物医学工程, 1999, 18 (3) :142-147.

[8]Heiko H.Susanne S, Madhukar P.Analysis of blood and bone marrowsmeal'8using digital image processing techniques[C]International Society for Optical Engineering, Proceedings of the SPIE Medical Imaging, San Diego, 2002:624-635.

[9]黄艺, 杜宇人, 基于边缘信息的图像分割技术研究[J].现代电子技术, 2005 (5) :116-117.

上一篇:矿山综合自动化下一篇:大理白族自治州