数学形态学处理

2024-09-22

数学形态学处理(共9篇)

数学形态学处理 篇1

1 图像分割的概述和定义

图像分割是指用区域对图像所进行的分割。这些区域的总和应覆盖整个图象, 而彼此互不重叠, 分割后的图像应具有相同的特性, 这些特性可以是形状、颜色、纹理、灰度等任何一个。在图像处理中, 图像分割时一个关键的步骤。因为在图像的研究过程中, 大家一般只对某些其中的部分感兴趣。为了更好的识别与分析目标, 往往要把这部分区域分割出来, 再对分割出来的目标作深层次的分析, 对目标进行特征的提取、参数识别和测量, 能更好的促进下一层级的图像理解和分析。

成像技术可以用来泛指所有与图像相关技术, 这些技术数量巨大, 我们可以把它们放到图像工程范畴里。图像工程分为理解、分析、处理三个层级, 且会研究所有涉及到图像的领域。图像处理是为了优化视觉效果, 分析是为了检测图像里我们所需要的信息。图像分割是一种重要的图像处理技术, 在实际的应用和理论研究中已经受到了人们的广泛重视, 在不同的研究领域图像分割有不同的名称, 如目标检测技术, 阈值化技术, 图像区分或求差技术, 目标识别技术, 目标轮廓技术, 目标跟踪技术等。

2 分水岭图像分割过程

我们将图像分割的过程描述如下:首先, 设想存在一个二维图像, 并认为它是一个三维地形表面, 且有一系列的低谷存在于该三维地形表面, 二维图像的表面像素点或最小值对应地形表面连接区的底部。假设我们将这些极小值刺穿, 将该三维地形表面逐渐浸至湖水中, 在上述过程中, 由于在湖内存在水压, 将会有水从被刺穿的洞中涌出, 这个涌出过程直至涌出的水与湖水高度相同才停止, 停止时水面已经完全将该三维地形表面浸没。然而在整个过程中, 不同的洞中将会涌出水并最终汇集于某一点。为了避免涌入的水汇集于某一点, 我们尝试提高该点的像素值。当三维地形表面浸至湖中的高度愈深, 我们所需要提高像素值的点就愈多, 这些被提高的点将会最终集合形成为一条竖直的线即水坝。在该三维地形表面被不断浸至湖中期间, 为了避免从各个洞中涌入水汇集, 我们不断设立水坝。若三维地形表面全部浸至湖中, 将能看到湖水被分割成若干个单独的水坝区域。

在上述的过程中, 我们采用湖水作为参照系。若我们变更参照系, 采用三维地形表面作为参照系。以三维地形表面作为参照系时, 我们认为三维地形表面不动, 湖水水平面处于匀速上升状态, 逐渐浸没整个地形表面。在浸没地形表面的过程中, 那些较为低洼的部分即图像谷底最先出现积水现象。伴随水平面不断上升, 出现积水现象的面积逐渐增大。为了避免各个山谷中积水连接到一起, 需要在连接处设立水坝。在整个三维地形表面全部被湖水浸没后, 我们将会发现湖水被水坝分割成若干个区域。上述漫水过程即分水岭图像分割过程。

在图像分割过程中, 分水岭算法就是将图像视为测地学中的拓扑地貌。该算法属于某种基于拓扑理论中数学形态学分割算法。某点的海拔高度采用图像中一个像素的灰度值来代表。集水盆也就是任何极小值和会被该值影响到的区域, 分水岭即为集水盆与集水盆之间的界限。该算法将梯度图像中像素值 (水位) 按升序进行处理。采用分水岭分割算法时, 将会把图像分割成若干个区域, 每个区域都和一个极小值点一一对应。

3 分水岭算法的具体实现

分水岭算法实质上属于某种区域增长算法, 该算法借鉴了地形学中的概念, 与之不同的是, 分水岭算法从图像中极小值开始增长。受暗纹理细节和暗噪声的影响, 可能有大量伪极小值存在于图像中, 而上述伪极小值可能会在图像中生成对应的伪积水盆。因此, 假如分水岭算法无法有效的将上述真、伪极而是小值区分开, 协同作为同一单独区域分割, 那么在最后将有可能产生分水岭较为严重的过分割问题。

当前用来克服过分割有以下两类主流的方法:一、先平滑处理再分水岭变换, 以期较少由噪声产生的过分割;二、在对小区域进行合并前分水岭变换, 将相邻的区域合并。其中方法一较为有效的减少了图像中的细纹和噪声, 但相应的降低了分割精确度, 造成了边界模糊的新问题;方法二在将区域合并的过程中, 需要大量的内存不停地释放、分配, 造成了耗时长、计算量大的新问题。

在进行图像分割时使用传统分水岭分割算法, 有可能出现为了保护物体边缘信息的需求与简化图像的需求之间的矛盾。大多数分水岭算法都是对已简化的图像进行处理, 所以我们要在简化图像时就考虑到物体边缘信息丢失的问题。出于保护图像的边缘信息的考虑, 我们可能无法有效地去除图像中的全部噪声, 这会导致可能有大量的伪极小值点存在于造成简化后的图像中。当我们分割简化后的图像时, 可能会造成较为严重的过分割后果。为了减少上述的过分割后果, 我们需要考虑与其它算法结合。假设采用基于标记的分水岭算法把被提取出来的标记当做被图像局部极小值, 在被处理的梯度图像上采取分水岭有可能获得较好结果, 这种基于标记的算法要点在于能够找到被分割图像中的物体的区域极大值点。由于分水岭算法是在被标记修改后的极小值原始梯度图像上所进行的, 因此能够保证分水岭分割图像边缘信息未受到影响。

我们采用分水岭来表示被输入图像的极大值点, 也就是集水盆间的临界点, 这个点通常通过分水岭变换获得。所以一般采用输入梯度图像, 用以获得图像的边缘信息。

式中, f (x, y) 表示原始图像, grad (·) 表示梯度运算, 分水岭算法进行图像处理时, 物体表面极其微小的灰度变化与图像中的噪声都有可能造成图像的过分割, 这是由于对微弱边缘分水岭能够产生理想的反应, 分水岭对弱边缘的上述理想的反应确保了将会得到连续、封闭的边缘。分析图像区域特征往往需要该算法所得到的封闭集水盆。我们大多数情况下可以采用下述处理方法以减弱分水岭算法可能导致的过分割:

(1) 对梯度函数进行修改使集水盆仅仅响应预期的目标;

(2) 依靠已知的情况减少无关的边缘信息。

减少分水岭算法导致的过度分割往往需要修改梯度函数, 而对该图像进行阈值变换往往是是简单有效的方法, 该方法能消除灰度的微小变化产生的过度分割。

式中, gθ 表示阈值, 而阈值的选取优劣直接绝对了分割结果是否令人满意, 因此选择更好的阈值往往是更好的进行图像分割的关键。

参考文献

[1]Vincent L, Soille P.Watersheds in digital spaces:An efficient algorithm based on immersion simulations[J].Trans.Pattern analysis and Machine Intelligence, 1991, 13 (6) :583-598.

[2]Zhang Y J, GerbrandsJJ.Objective and quantitative segmentation evaluation and comparison.Signal Processing, 1994, 39:43-54.

[3]Serra J.Image.Analysis and Mathematical Morphology.Academic Press, London, 1988.

[4]Matheron G.Random Setsand Integral Geometry.New York:Wiley, 1975.

[5]Serra J.Image Analysis and Mathematical Morphology.New York:Academic, 1982.

[6]姚敏.数字图像处理[M].北京:机械出版社, 2006, 110-117.

[7]马东, 曹培杰, 潘凯丽.分割重叠细胞核的方法及比较研究[J].北京生物医学工程, 1999, 18 (3) :142-147.

[8]Heiko H.Susanne S, Madhukar P.Analysis of blood and bone marrowsmeal'8using digital image processing techniques[C]International Society for Optical Engineering, Proceedings of the SPIE Medical Imaging, San Diego, 2002:624-635.

[9]黄艺, 杜宇人, 基于边缘信息的图像分割技术研究[J].现代电子技术, 2005 (5) :116-117.

[10]Horowitz S L.Picture Segmentation by a Directed Split-and-Merge Procedure.Proceedings of Second International Joint Conference on Pattern Recognition, 1974, 8:424-423.

数学形态学处理 篇2

关键词:修剪;大树截干;树木安全性;树木生理

中图分类号:S688

文献标志码:A

文章编号:1671-2641(2015)06-0070-04

收稿日期:2015-04-07

大树截干,对应国外“Toppi-ng”,指仅保留成年乔木的主干或重短截所有主枝,以控制树木体量的一种修剪方法,也常用于老树复壮和大树移植。南洋楹alcataria moluccana和非洲楝Khayasenegalensis属于热带速生树种,因用材和绿化价值于1940年前后引入华南地区。白兰Michelia alba原产于印度尼西亚,树干通直,生长快,常用于园景树和行道树。然而,速生树种寿命较短,生长到一定程度后,开始表现出衰老的特征,如离心秃裸、顶梢枯萎或受寄生植物危害等,在台风多发季节,容易发生倒伏或折技,因此园林中常对萌芽力较强的树种进行截干处理,确保安全并能促进新枝条萌发。

一直以来,国内外学者对大树截干大多持反对态度,认为截干破坏树体结构和树冠自然的形状,增加树体潜在的不安全因素,应该慎用。另外,截干导致截口腐烂、根系损伤等问题,对树木造成不可挽回的伤害。本文对三种已截干一年的园林树木的生长情况进行调查评估,应用树木生理学原理,分析截干处理对于树木生长及其形态结构的影响,从而探讨这种修剪方法的适用性。

1 材料与方法

广州市位于北纬23°05′~23°20′,东经1130°20′~113°35′,地处亚热带季风气候区。温暖多雨,光照充足,温差较小。年平均气温为21.5℃~22.2℃,年平均雨量为1640~1970mm。广州市水热条件较好,地带性植被为南亚热带季风常绿阔叶林。一些热带性树种如南洋楹、非洲楝和白兰在广州地区均表现出较强的生长势。

根据树皮开裂及枝条萌发程度、树体结构及整体长势,结合植株的胸径、倾斜程度、病虫害情况等,对广州市三所大学校园内南洋楹、非洲楝以及白兰三个园林速生树种截干一年后植株的受损伤程度进行分级。分级标准如下:

A级(受损伤严重):树皮大面积脱落,难以萌发新枝,树势衰弱或植株死亡;

B级(受到一定损伤):树皮局部开裂,萌发新枝较稀疏,树势和树体结构一般;

C级(受损伤较轻):树皮基本健康,萌发新枝能力较强,树势和树体结构良好。

2 结果与分析

2.1 截干树木总体生长情况分析

被截干处理的南洋楹主要分布于华南农业大学,华南理工大学五山校区和华南师范大学石牌校区也有零星分布。大部分植株定植于上世纪六七十年代。2013年9月,学校对部分开始表现出衰老症状、树龄较大的植株进行截干处理。华南农业大学六一区和三角市的非洲楝生长较快,植株较高,树冠庞大,并处于人流量较大的路段。学校于2013年对其中一部分非洲楝进行截干处理,并用金属支架对倾斜严重的植株进行支撑(图1)。被截干处理的白兰位于华南师范大学玉兰路两侧,植株高度已接近20m,遮蔽了两侧住户的房屋光线,台风季节树体摇摆幅度大,威胁到周围居民及行人的安全。

调查的截干南洋楹53株、非洲楝20株、白兰40株。胸径范围为0.3~1.5m(表1)。植株胸径越大,其树势恢复越困难。具体表现为截口无法愈合、树皮与木质部分离、隐芽萌生等。统计显示,受损伤程度较大(A级)的植株共19棵,占比为17%,主要为树龄和胸径较大的南洋楹,多表现为树皮大面积脱落,不再萌发新枝,宜及时移除;受到一定损伤(B级)的植株共35棵,占比为31%,主要为胸径较小的南洋楹,应对保留植株进行支撑,定期巡查,如情况恶化要及时移除;受损伤较轻(C级)的植株共59棵,占比为52%,主要为胸径较小或保留分枝较多的非洲楝和白兰,多表现为树势较好,萌发的枝叶较为健康,树势和树体结构较好的植株可保留并进行支撑,定期修剪及重新培养树形。

2.2 截干处理对地上部分的影响分析

2.2.1 截口难以愈合

截口的愈合需要营养支撑。截干去除了树体大部分光合器官,减少了树体主要的营养库源,加剧树势衰弱程度,降低树木对病虫害的抵御能力。截口的大面积裸露,使得雨水容易渗入导致木质部腐朽。加之病菌在树干纵向蔓延速度远大于径向,故截干伤口腐烂的蔓延速度与范围远大于一般侧枝的修剪截口。截口愈合缓慢及腐烂使得病虫更易从截口处入侵树体,导致主干或主枝腐烂,存在较大的安全隐患。调查中,仅保留主干的截干植株共40株,保留一级分枝的植株共68株(表1)。顶部截口规格较大,难以愈合,而采用疏枝处理后,非洲楝主干上的一级大枝截口有轻微愈合迹象,白兰一级大枝截口愈合迹象较明显(图2)。

2.2.2 树皮开裂与剥落

截干一年后,有8株南洋楹的树皮大面积脱落且不再萌发新枝(图3)。这是由于叶子大量丧失,韧皮部中负责输导有机养料的部分筛管长期处于“停工”状态。而韧皮部长期得不到营养供应,筛管逐渐失去运输功能,形成“断流”。另外,叶幕的大量缺失导致树干受阳光直射的时间更长,而昼夜温差较大使失去活性的韧皮部热胀冷缩程度大于木质部,最终产生开裂并与木质部分离。树皮大面积剥落意味着树木失去向下运输营养的机制并逐步走向死亡。而非洲楝和白兰只有个别植株树皮上有轻微开裂并伴随病虫害入侵迹象。

nlc202309011705

2.2.3 大量隐芽萌发

截干后,3个树种均产生一系列类似的响应机制适应营养制造器官的骤然缺失。其中最主要的是主干上大量隐芽萌发,形成丛生的枝条(图4),叶片变大(非洲楝),以尽快弥补光合器官的缺失。枝条的数量与树干积累的营养以及树龄有关。树干积累营养越多或树龄越小,生势越强健,萌发枝条越多,枝条生长越旺盛。也有部分植株因树势衰弱,无法萌芽,继而死亡。由于截干消除了主干的顶端优势,截口下方枝条迅速生长,节间较长,木质部较正常枝条疏松。另外,枝条易呈轮生或丛生状态,分枝角度较小,容易产生内含皮削弱枝条与主干间结构。由隐芽萌发的侧枝基部只与树干表层的木质部相连接,强度低于正常逐级分枝过程产生的枝条。

2.3 截干处理对地下部分的影响分析

植株地上部分枝叶与地下部分根系的生长相互依赖,相互制约,保持相对的平衡。叶片光合作用制造的养分为根部提供营养,同时根系也为枝叶的生长提供水分和营养元素。截干导致地上部分枝叶在极短时间内大量丧失,使根系生长骤然降低,长时间失去营养支持,进而使根系受损并逐渐失去吸收水分的能力。

调查中,胸径大于0.6m的截干植株共35株,其中有7株胸径超过1m(表1)。进入衰老期的树木新陈代谢变慢,其胸径越大,地上部分生长量越大,根系越发达,截干产生的损害越大。个别树木截干后因根系受损无法正常吸水,导致保留的或新萌发的枝叶缺水萎蔫(图5)。树木根系衰弱严重影响树木健康,一旦病虫侵蚀树根,可能导致植株在台风季节倒塌,存在较大安全隐患。

2.4 小结

对比3个树种截干后的整体生势及生长特点可以得出,非洲楝和白兰截干后的恢复情况比南洋楹更好(图6)。这与树种特性、立地条件、树龄都有紧密联系。南洋楹树龄较大,寿命较短,早期受寄生植物危害,树势较衰弱,因此恢复情况较差。截干对树木生长及形态结构的影响可以总结如下:¨截干截除了绝大部分分枝,破坏树体结构,影响景观效果;2)大量隐芽的萌生导致枝条与主干连接不紧密。这些枝条比较脆弱,台风季节容易折断,形成安全隐患。另外,新枝增粗速度远大于主干,容易撑裂树皮并形成较大的裂口。3)截干容易导致根部衰弱,进一步加快树势的衰退。4)切口难以愈合,若腐烂易蔓延至整个主干,树体有倒塌的危险;5)厚重的树皮高空坠落容易伤人,特别是植于路边的行道树。

3 讨论与建议

自然界中,树木能根据生长环境和自身长势的变化而自行“修剪”,即“自剪”。人为的修剪往往是为了控制长势、调整树体结构等。因此,修剪人员应清楚了解修剪后树木的生长反应,才能达到预期的修剪目的。正常情况下,成年大树年龄越大,生长越趋于缓慢,顶端优势消失,截口愈合缓慢,抗逆性变差等等。因此,大部分成年大树的修剪仅局限于树冠清理。而截干的截面越大,对树木的伤害就越大,恢复其正常生长的难度也就越大。

树木在栽植前应适地适树,并考虑日后的维护需求。如珠江公园将南洋楹栽植在游人较少的疏林草地中,避免台风季节枝条跌落砸伤行人。当然,许多原本栽植在行人稀少处的树木,也会因为周边用地性质的改变而成为安全隐患。因此,在规划时要考虑到用地原有大树可能发生的情况,特别是价值较高的古树名木,尽量避免日后因安全问题对其进行截干。

对于体量过大且存在安全风险的树木,修剪应至少保留到2级主枝,并在根系和枝条生长缓慢季节如(华南地区)12月到次年2月份进行,避免根系营养供应不足导致树木生长不良,或枝条生长过快导致与树体接合处结构不紧密。同时避开病虫害高发季节,减少病虫从修剪截口处侵染树体的机会。体量较大的植株截干后根系受损,应对其进行支撑围护避免树体倒塌。截干后,宜对萌生的枝条进行适当筛选,根据截面的大小,选留分枝3-5条,重新构建树体骨架。应当及时清除难以通过修剪来排除安全性隐患的树木,并在原处附近补种合适的新树种。

参天大树不仅体现出场所的历史性,还能营造良好的景观效果,但其内在的风险不可忽略。对于存在安全隐患的大树,应该理性取舍,以人民群众的生命财产安全为首位。本文旨在加深公众对速生树种老龄植株潜在的安全隐患及修剪或砍伐危险性树木工作的了解。

数学形态学处理 篇3

1 数学形态学的基本理论

数学形态学[5]是一门新兴的图像分析学科。其基本思想是用具有一定形态结构的结构元素(structuring element)去探测一个图像中的形态,以解决图象的理解分析问题。数学形态学的四个基本运算是膨胀(dilation)、腐蚀(erosion)、开(opening)和闭(closing)。

开运算[6]是先腐蚀后膨胀的结果,对图像A及结构元素B,用A。B表示A对B的开运算,即。闭运算是先膨胀后腐蚀的结果,用A·B表示A对B的闭运算,即。形态学作为一种非线性滤波方法,与其它方法相比有以下优点:1)良好的抗噪保边性。原始图像含有大量加性和非加性噪声,线性滤波基于频域分割原理,在平滑噪声的同时会模糊诸如边缘等图像的细节。形态学滤波是一种非线性滤波,它在去除图像中各类噪声的同时又保持了物体边缘的清晰。

2)图像处理的局部性。形态变换是对图像的局部变换,即运算只和某点邻域内的信息有关而与整体信息无关,这样就大大压缩了信息量,并且可以通过直接调整结构元素的形状来调整图像的处理结果,为图像的实时预处理提供了一个有效的途径。

3)处理并行性。数学形态学的最大特点就是将大量复杂的图像处理转换成最基本的平移与逻辑运算的组合来完成,因此便于并行处理和硬件实现,而且它算法灵活,运行速度快捷。

2 图象增强

图像增强[7]的目的是采用一系列技术去改善图像的视觉效果或将图像转换成一种更适合于人眼观察和机器自动分析的形式。目前对图像的增强效果还缺乏统一的理论,因而一些增强方法往往带有针对性,以致对某类图像效果较好的增强方法未必一定适用于另一类图像。在实际情况中,要找到一种有效的方法常常必须广泛地进行实验。经常采取的方法是:使用几种增强技术的组合,或使用“可调”方法。这些可调方法的参量视图像的局部情况而逐处改变。常用的图像增强方法有均值滤波法、中值滤波法以及Butterworth高通滤波等方法。

2.1 基于数学形态学Top-Hat算子的去噪技术

Top-Hat算子根据使用开、闭运算的不同而分为开Top-Hat算子和闭Top-Hat算子。

开Top-Hat算子(Opening Top Hat)定义为:

闭Top-Hat算子(Closing Top Hat)定义为:

Top-Hat具有高通滤波的某些特性,即开Top-Hat算子能检测图像中的峰,而闭Top-Hat算子则能检测图像中的谷。由于开Top-Hat形态滤波运算在清除小目标的同时也滤除了大量的噪声点,而原图像与开运算结果相减后留下了小的疵点和大量的噪声,所以它对于信噪比的改善并不突出。

针对上述问题,提出了一种改进方法,具体实现如下:

第一步:用一略大于疵点尺寸的结构元素对原始图像进行开运算。疵点与孤立的小噪声块的面积很小,它们在模板中所占成分极小,基本上被平滑了,得到的图像可以认为就是背景。

第二步:用一个很小的结构元素(小于疵点尺寸取3×3)对原始图像进行开运算。此时,小的噪声已经被滤除,在背景区域滤波后得到的仍然是背景平滑的结果,从而与第一步操作相匹配,实现了对背景平滑的补偿;而在目标区域,由于结构元素的尺寸小于疵点,疵点依然保留了下来。为了在处理后的图像中保持边缘信息,这里采用全方位的结构元素。

第三步:求两次滤波所得的图像之差。

2.2 实验与分析

以下图像分别为原始图像和采用均值滤波、中值滤波,Top-Hat形态滤波以及改进的形态滤波进行图像增强的结果图像。并且对于处理后得到的图像进行了信噪比改善的计算。

1)均值滤波

根据帘子布疵点的类型和大小,这里选取30×30的窗口,用邻域平均法对图像进行滤波。用原始图像减去滤波输出的图像得到结果。

2)中值滤波

由于中值滤波器可以滤除窗口一半大小的脉冲,根据图像中疵点的大小,选取50×50的窗口。用原始图像减去滤波输出的图像得到结果。

3)Top-Hat形态滤波

根据疵点的大小选用30×30的圆形结构元素对原始图像进行开运算,然后将原始图像与开运算结果相减得到结果。

4)改进的形态滤波

依然选用30×30的圆形结构元素对原始图像进行开运算,得到背景图像;用3×3的全方位结构元素分别对原始图像进行开运算,得到平滑后的含有疵点的图像:

结构元素,目标图像,。用处理过的目标图像减去背景图像得到结果。

5)信噪比的改善

由于滤噪的最终目的就是提高图像的信噪比,因而,滤波前后信噪比改善的程度是算法性能优劣的一个直接表现。在采用信噪比指标对算法性能加以比较之前,现对几个参量定义如下:

(1)幅度信噪比

疵点与背景的幅度信噪比定义为

其中,S为疵点的平均灰度;μ为背景图像的均值;σ为背景图像的灰度标准差。

(2)信噪比增益

信噪比增益,即信噪比改善因子,它反映了处理前后图像的信噪比改善情况。其具体定义为

其中,SNRi为原始图像的信噪比;SNR0为处理后输出图像的信噪比。

由表1所示数据可知,改进的形态滤波算法在信噪比改善方面具有较好的性能。信噪比要高于常用的均值滤波器,特别是对高频噪声的抑制能力比较强,较好的滤除图像中的尖峰和凹陷。均值滤波在信噪比的改善方面并不突出,而且运行时间较长。Top-Hat形态滤波在运算速度方面表现突出,但对于信噪比的改善欠佳,这也正是我们改进算法的原因。

摘要:该文提出了一种基于数学形态学的图像预处理方法。首先对原始图像进行了改进的形态滤波处理,依次用一个略大于目标尺寸的结构元素和一个小于目标尺寸的结构元素对原始图像进行开运算;求两次滤波所得图像之差作为图像增强后的结果。实验结果表明,此方法最大限度地消除了各种噪声和畸变对图像中目标区域的影响,更加完整的保留了目标边缘的细节信息。

关键词:数学形态学,图像预处理

参考文献

[1]李刚,范瑞霞.一种改进的图像中值滤波算法[J].北京理工大学学报,2002,22(3):36-38.

[2]吕文阁,刘建群,杜建辉.应用机器视觉的工件表面检测[J].机床与液压.2006(4):32-35.

[3]戴君.数学形态学在图像处理中的应用[J].佛山科学技术学院学报,1998,16(2):29-31.

[4]张莹.开闭运算在消除图象噪声中的应用研究[J].潍坊学院学报,2002,2(2):65-66.

[5]Serra J.Image Analysis and Mathematical Morphology.Vol.l New York:Academic press,1982:20-28.

[6]刘剑.基于数学形态学的形态滤波算法研究[D].哈尔滨:哈尔滨工程大学,2006:21-28.

数学慢教育科学认知的四种形态 篇4

摘要数学慢教育范畴的科学认知形态是在研究现有文献的基础上,结合学生的数学事实和认知规律进行层次性划分,包括整体主义形态、监控主义形态、直观主义形态和客观主义形态.这些科学认知形态具有思维清楚、概念透明的理性价值特征,投射了慢教育数学“大过程”的过程性思想和科学认知精神.

关键词慢教育;数学;科学认知

数学慢教育[1]作为认识论范畴一种科学认知学,起于意义建构,终于数学理解,终归于科学认知形态的定向发展.已有文献将科学认知理解分为四个层面:工具性理解模式、关系性理解模式、直觉性理解模式和形式性理解模式[2].这些结构化心理模式在一定维度决定个体学习能力的层次.数学认知理解在众多数学能力因素中占据核心地位,在数学学习过程中表现为素养层面的个性心理品质.数学慢教育范畴的科学认知形态是在现有文献研究基础上,结合学生的数学现实和认知规律进行层次性划分,包括整体主义形态、监控主义形态、直观主义形态和客观主义形态.这些科学认知形态的“大过程”特征是思维清楚、概念透明.

工具性理解[3]是一种程序性理解即一个规则R所指定的每一个步骤是什么,如何操作.程序性本身具有“通体相关”的特性,揭示慢教育整体主义认知形态的过程要义.关系性理解[4]则需要添加符号意义和替代物本身结构上的认识.关系理解是元认知作用的过程,反映慢教育监控主义认知形态的思想意义.直觉性理解是在观察、想像、审美活动中,产生突如其来的顿悟和理解,具有逻辑程序高度约简的特点[5].直觉性是直观选择作用的概括化,体现慢教育直观主义认知形态的科学性质.形式性理解是对数学对象的外在表征,是数学观念、思想、方法客观化的结果,是事实数学与数学事实联结的介质[6].形式性是数学概念得以还原的外在法定的标准,投射慢教育客观主义认知形态的科学精神.

1整体主义认知形态

迪尔凯姆在认识论上坚持整体主义取向,认为社会事实必须在社会结构中得到解释;在价值观上,体现集体主义取向[7].把这种整体主义社会关系论借用到数学慢教育认识形态领域,则反映慢教育整体认知的科学性.社会事实与社会结构关系的关系,正是慢教育整体认知的思想渊源.换句话说,整体认知不是孤立行为,而是系统行为.在数学解题学领域我们挂在嘴边的口号就是“做一题、通一类、连一片”.事实上,数学慢教育背景下,整体主义认知形态的本质就是把问题放在系统层面去解决,带有科学性“知一点、识一线、明一片”的整体意义.不是“头痛医头,脚痛医脚”的局部观.尤其是核心概念的建设问题,不仅要让学生掌握课时背景下的“小概念”(静态概念),还要放在单元系统层面,通过横向关联、纵向链接等拉长概念思维长度的方式,实现对“大概念”(范式概念)的定性把握.

数学慢教育课堂整体主义认知形态具体表现在以下三个层面:一是站在系统思维层面设计整体性问题;二是以问题组块的形式进行整体架构;三是以还原概念作为数学思考的主流.比如我们在“探索三角形相似的条件”时.苏科版九年级《数学》下册编者是按照“平行线等分线段定理→两角对应相等→两边对应成比例且夹角相等→三边对应成比例”的逻辑顺序展开的,遵循“前概念+证实+应用”的思维线索,即“一课一条件”的板块学习式.这种“割裂带”认知形态有利于学生暂时掌握课时“小概念”,但因缺乏概念的系统性,造成出了课堂就被忘掉的认知事实.课题组基于整体认知形态,对该教材进行整合、重组和改造,将4个课时进行系统性立体划分.第1课时专门研究三角形相似四个条件的前概念;第2课时主流任务是证实三角形相似的条件;第3课时是学以致用;第4课时是综合变式并链接中考及后续待学内容.如果整合是系统思维的内在需求,那么重组是整体认知的逻辑起点,改造则是科学认知的最高目标.事实上,课时重新划分本身就反映整体主义认知思想,综合变式与链接行为则是问题组块的组织路径,而寻找前概念、证实以及致用等整体认知形态则是还原概念的外在表现,实现了概念在概念系统中生成的整体主义认知取向.2监控主义认知形态

监控主义属于元认知范畴,元认知包括策略性知识、认知任务知识、背景和条件知识以及自我知识[8].现代信息加工心理学,提出高效学习心理结构主要包括选择性注意、元认知、学习策略、非智力因素、内隐认知等要素[9].数学元认知包括数学元认知知识、元认知体验与元认知监控.其中元认知体验与自觉监控自己的数学行为过程,是一种高级形态的学习要求,不易支配实行与适切评价.数学慢教育研究组,基于策略性方法层面提出可操作的“反问式监控”和“追问式调节”.反问式监控主要是让学生在数学活动中即时解释在做什么,为什么做,随后还需要做什么等哲学层面的动作行为;追问式调节则倾向于怎么做,做得怎样,还可以怎样做的数学哲学思考.其实监控认知形态是数学认知关系中最活跃的因素,能有效促进问题产生式定向形成,是“定法多用”的典型方法.

数学慢教育课堂监控主义认知形态具体表现在以下层面:一是让学生在活动中养成反思的习惯;二是让学生在问题解决中提出质疑的习惯,三是让学生在小结“节点处”提出批判性思考.比如,我们在研究“组合矩形”新概念时,设计了如下监控认知活动:(1)图1是一块直角三角形纸片.将该三角形纸片按下图方法折叠,使点A与点C重合,DE为折痕.试说明△CBE是等腰三角形;(2)再将图1中的△CBE沿对称轴EF折叠(如图2).通过折叠,原三角形恰好折成两个重合的矩形,其中一个是内接矩形,另一个是拼合(指无缝无重叠)所成的矩形,我们称这样的两个矩形为“组合矩形”.你能将图3中的△ABC折叠成一个组合矩形吗?如果能折成,请在图3中画出折痕;(3)请你在图4的方格纸中画出一个斜三角形,同时满足下列条件:①折成的组合矩形为正方形;②顶点都在格点(各小正方形的顶点)上;(4)有一些特殊的四边形,如菱形,通过折叠也能折成组合矩形(其中的内接矩形的四个顶点分别在原四边形的四条边上).请你进一步探究,一个非特殊的四边形(指除平行四边形、梯形外的四边形)满足何条件时,一定能折成组合矩形?问题(1)证实等腰三角形的过程就是对“折”的活动的具体反思;问题(2)(3)折和画满足特定条件的组合矩形行为就是质疑思维的养成事件,尤其是对“斜三角形”本质定位,则是质疑的内部表现;问题(4)探讨非特殊四边形折成组合矩形条件的过程就是批判思维发挥作用的过程.事实上,就统觉加工论而言,“折”与“画”的动作本身就带有强烈的反思(我在做什么)和质疑(这样做的结论是什么)性质.由菱形性质的示范性研究(对角线互相垂直),到一般非特殊四边形条件的探讨(对角线必须满足怎样的条件,才能实现目标),学生的批判性思维在监控与调节中呈现“不平衡→平衡→不平衡”的状态,终于新概念的定向迁移(非特殊四边形必须满足对角线垂直的条件).

图1图2图3图43直观主义认知形态

直观(intuition)主义带有强烈的哲学色彩,其核心内容是“存在必须是被构造”.为此,数学中的直观主义与哲学中的康德主义具有内在一致性,主张数学概念由人类的理性构造形成.数学对象的构造就是人们先验的在直观中画出与概念相应的图形,因此构造数学需要非经验的直观.数学家克莱因认为,数学的直观就是对概念、证明的直接把握[10].可见,直观具有缩短发现真理历程的作用,对数学概念的理解与生长具有不可替代性特征.这是《义务教育数学课程标准(2011年版)》(以下简称“后课程标准”)为什么把“几何直观”作为十大核心概念之一提出的重要原因.数学慢教育课堂的直观主义认知形态就是通过选择直观性材料,让学生在直观活动中寻找“前概念”,在直观“做数学”中还原主概念,在直观“用数学”中延伸后概念,终于对数学概念的直接理解和知性把握.

“后课程标准”指出,借助几何直观可以把复杂的数学问题变得简明、形象,有助于探索解决问题的思路,预测结果;可以帮助学生直观的理解数学.这些直观化的作用正是数学慢教育选择直观认知出发的理由.众所周知,“因式分解”对于形象思维尚占主导地位的初中学生来说,“说教式”认知理解是困难的.为此,慢教育课题组选择直观实验的方式,帮助学生理解“多项式的因式分解”.具体操作如下:首先让学生准备边长为a的正方形纸片若干张,边长为b的正方形纸片若干张,长为a、宽为b的长方形纸片若干张.其次让学生任意拼正方形,并写出边长与面积的关系式.再次让学生用边长不同的两个正方形沿邻边覆盖的方式,规定阴影部分为减去覆盖部分的面积,用不同方法表示阴影部分的面积,并写出关系式.最后让学生写出简单的多项式并进行因式分解,再通过拼图的方式验证其正确性.“拼图”是苏科版《数学》七年级下册第九章章末设置的数学活动,目的是初步引动“数形结合”经验.任意拼正方形的认知行为就是寻找因式分解的前概念行为;覆盖活动的探讨就是解决拼图不完备(“纯和”形式的多项式)的弊端,为“完形”理解因式分解提供直观的加工材料;任意“写→拼→写”以及内部关系的寻求是直观还原概念的关键性事件,也是直观“用数学”的典型案例.这些直观的做、说、用的活动过程与结果,终于因式分解概念本质的直接把握和定向生长.4客观主义认知形态

客观主义坚持物质世界是实在的、有结构的,人类的思维任务就是反映这些客观实体及其结构.这是数学慢教育坚守客观主义认知行为的科学根据.已有文献[11]指出,数学作为一门精确科学,其研究活动必须以量和质、内容与形式的分离为前提,把前者从自然界的普遍联系中抽取出来,加以抽象,在不断形式化的过程中实现它的精确性,这个过程就是客观数学化.这就说明数学的抽象与现实世界是紧密联系的,客观化(形式化)既可以刻画具体问题的数学模型,也可以反映各种层次的数学概念或规律的更高层次的抽象.数学通过形式化能实现它的精确性,但数学思想是独立于言语的形式之外的客观精神实体,同时数学又必须通过一定的形式来表达,才能实现其严格化和完美化.数学慢教育作为客观辩证法范畴,认知理解形态的客观性具体表现在三个维度:一是通过活动让学生切身经历“事实经验→个体经验→客观经验”的转化过程;二是让学生在形成和同化概念的过程中把握概念的客观属性;三是让学生在问题解决中认识“原型内化”对知识加工的客观意义.

我们在研究苏科版九年级《数学》上册“等可能性”时,就是基于客观主义认知形态把握概念的.思维反应块组织如下:(1)你能用数学眼光揭示成语故事“瓮中捉鳖”“一箭双雕”“守株待兔”“水中捞月”的数学属性吗?(2)一个不透明的袋中装有除标号外质地一样的10个小球,你认为每次只摸一个球,有几种结果,这些结果是等可能的吗?(3)在(2)的背景下,袋中只有2个红球和1个白球,每次只摸一个球,摸到红球和白球的可能性一样吗?为什么?学生对问题(1)的个性理解、集体研讨、认证判断的过程就是“个体经验”到“公共经验”客观化的认识过程,反映加工概念的客体意义,并使得随机事件、必然事件和不可能事件的数学内部关系趋于结构化,为新知学习提供客观经验根据.对问题(2)的探讨过程就是学生形成并同化概念的客观形态,抽象概念本质属性的行为就是形式化数学的外在表现.对问题(3)的解决则是“用数学”的客观表现,揭示了概念的本质特征(是随机事件、每次只有一个结果、结果具有等可能性)对问题解决的客观指导意义.由此可见,数学慢教育客观主义认知数学的本质就是在生活中提炼数学,在数学思考中联系生活,终于原型定向到原型内化的科学认识观.作为数学思维成果或对象的抽象物(模式),一经构造出来就具有“形式客观性”和独立存在性,因而立即获得了自己的生命,从而又可以成为后继的进一步抽象的具体原型(或实际背景).[12]这既反映慢教育客观主义认知形态的本质要义(模式建立与形式客观性共存),又在形式化层面揭示客观概念(等可能性)反应块建设的科学意义.

数学慢教育科学认知不止于以上四种主流认知形态,还包括表象主义认知形态、经验主义认知形态、结构主义认知形态以及审美主义认知形态等带有流变性特征的思维科学,限于文本研究方向,在这里不予研究.

参考文献

[1]朱桂凤,孙朝仁.数学慢教育研究综述[J].江苏教育研究,2013(7A):47-50.

[2]马复.试论数学理解的两种类型:从R.斯根普的工作谈起[J].数学教育学报,2001(3):52-55.

[3][4]王光明.数学教育研究方法与论文写作[M].北京:北京师范大学出版社,2010:73.

[5]萧柏荣.数学教育探索五十年[M].南京:南京大学出版社,2012:44-51.

[6]徐文彬.关于数学文化视域中数学学习的构想[J].数学教育学报,2014(5):1-5.

[7]施磊磊.一种“科学”认知范式的产生——读迪尔凯姆《社会学方法论的准则》[J].西安社会科学,2009(9):43-45.

[8]黄梅,黄希挺.知识的加工与教学条件[J].教育研究,2015(7):108-115.

[9]沈德立.高效率学习的心理学研究[M].上海:商务印书馆,2000:26-27.

[10][11]秦德生,孔凡哲.关于几何直观的思考[J].中学数学教学参考,2005(10):9-11.

数学形态学处理 篇5

关键词:数学形态学,加权平均,均值滤波,中值滤波,形态学滤波

0 引 言

近年来, 字符识别技术已发展成为当今一个热门的主要研究领域, 在许多领域都需要对字符做识别操作, 例如:车牌字符识别[1]、手写体字符识别[2]、运动工件上的字符识别[3]等。字符图像往往会受到各种噪声的污染, 以及字符笔划断裂情况等, 这些都会严重影响字符识别的准确度。许多学者针对消噪提出了一些解决方案, 如:基于直方图特性的图像去噪方法[4], 基于数学形态学的图像去噪方法[5], 基于小波变换和中值滤波的图像去噪方法[6]等。该类方法为消除图像噪声, 以及桥接笔画断裂字符提出了一些效果好, 可行的算法。

1 理论基础

文中用到的理论知识主要包括数学形态学、图像的代数运算以及图像滤波处理技术。

1.1 数学形态学方法原理

数学形态学是建立在积分几何和随机集论等严格数学理论基础上的一门密切联系实际的学科。它用于图像处理的基本思想是利用一个称作结构元素的“探针”, 收集待处理图像的信息, 探针在图像中不断移动, 即可考察图像物体间的相互关系, 提取出有用的特征[7]。所有的形态学处理过程都是基于填充结构元素的概念。二值形态学中的运算对象是集合, 通常给出一个图像集合和一个结构元素集合, 利用结构元素集合对图像进行操作。

膨胀和腐蚀分别用数学符号“⊕”和“Θ”表示, 若A, BZ中的集合, ∅为空集, 则A被结构元素B膨胀和腐蚀的定义[8]分别如式 (1) 和式 (2) 所示:

AB={z|[ (B^) xA]} (1) AΘB={x| (B^) xA} (2)

1.2 图像的代数运算

代数运算是指对两幅输入图像进行点对点的加、减、乘和除计算而得到输出图像的运算。图像相加的一个重要应用是对同一场景的多幅图像加权求取平均值, 以达到消除加性随机噪声的目的。

fi (x, y) =f (x, y) +ni (x, y) g (x, y) =f (x, y) ¯=1Νi=1Νfi (x, y) E{g (x, y) }=0, σg (x, y) =1Νσn (x, y) 2 (3)

式中:f (x, y) 是静止图像;ni (x, y) 是加性随机噪声。式 (3) 表明对N幅图像平均可把噪声方差减少N倍, N越大, g (x, y) 就越接近于f (x, y) , 噪声的影响逐步减少。

1.3 滤波处理

滤波处理主要用于平滑图像、消除图像噪声的目的, 最常用的祛除噪声方法是用滤波器进行滤波处理。可以根据不同的需要构造不同的空域滤波器, 如均值滤波器、中值滤波器、维纳滤波器等。

1.3.1 中值滤波

中值滤波是基于排序的非线性平滑滤波器, 它既可消除噪声, 又能保护图象的细节[9]。中值滤波步骤为:

(1) 将模板在图像中漫游, 并将模板中心与图中某个像素位置重合;

(2) 读取模板下各对应像素的灰度值;

(3) 将这些灰度值从小到大排成一列;

(4) 找出这些值中排在中间的一个;

(5) 将这个中间值赋给对应模板中心位置的像素。

1.3.2 均值滤波

均值滤波是将一个像元及其邻域中所有像元的平均值赋给输出图像中相应的相元, 从而达到平滑的目的。

2 算法实现

本文采用加权平均、形态学腐蚀以及均值滤波相结合的方法实现了消噪, 并且有效地实现了比划断裂字符的桥接功能。同时将新算法的处理结果与过去常用的算法处理结果做了比较。

2.1 新算法设计并仿真实现

本文称这种算法为组合滤波桥接算法, 算法设计步骤:

(1) 对噪声图像如图1所示做加权平均操作, 得到加权平均图像, 如图2所示, 在本文中加权次数取为100即可;

(2) 选取一个结构元素对加权平均图像做膨胀操作, 获得膨胀图像如图3所示;

(3) 对膨胀图像做均值滤波得到组合滤波桥接图像, 如图4所示。

算法步骤说明, 在经过步骤 (1) 后, 由于加权平均消噪的原理可知, 通过试探选择合适的叠加次数, 仅完全消除了黑色背景上的盐噪声, 而白色字体上的椒噪声仍然存在, 并且从图中可以看到由于椒噪声的存在, 使得字符笔划不连通, 产生了间断。因此对加权平均图像做膨胀操作, 膨胀结构元素通过试探的方式选取, 本文经试探选取的结构元素SE=[0, 1, 0;1, 1, 1;0, 1, 0]。从图3可见, 通过膨胀操作后, 字符断裂的笔划被桥接上, 但是其边缘仍存在部分噪声。所以需进行第 (3) 步的操作。可以看到, 通过组合滤波桥接算法运算后, 噪声基本被消除, 笔划断裂的字符被桥接上。可见, 对图4进行字符识别, 可以大大提高其识别正确度, 并且不再需要考虑字符笔划断裂的情况, 因此用普通的字符识别算法就可得到很高的识别准确率。

2.2 组合滤波桥接算法与其他滤波桥接算法效果展示

为了能清晰地看出不同算法的滤波桥接效果, 图4~图6放大了“ea”字符串。图5是对受噪图像直接中值滤波, 再用结构元素SE桥接的效果图;图6是用常用的形态学滤波[9]消噪, 再用结构元素SE桥接的效果图。

由图4~图5可见, 组合滤波桥接算法不仅能消除图像噪声, 而且还能完全桥接笔划断裂字符, 这点是其他算法所不能及的。图1的缩放比例尺寸为:宽36%, 高36%;图2的缩放比例尺寸为:宽34%, 高35%;图3~图6的缩放比例尺寸为:宽35%, 高35%。

3 结 语

由以上理论分析和仿真实验表明, 组合滤波桥接算法不仅能消除图像噪声, 而且还能完全桥接笔划断裂字符, 解决了识别笔划缺损字符的识别难点, 从而达到提高字符识别准确度的目的。

参考文献

[1]孙炎增, 张前进.车牌字符识别技术的研究与实现[J].微电子学与计算机, 2008, 25 (6) :101-104.

[2]孙光民, 张程, 王鹏.基于非线性PCA神经网络的手写体字符识别[J].北京工业大学学报, 2007, 33 (9) :915-919.

[3]孙护军.运动工件上字符识别系统研究[J].西安航空技术高等专科学校学报, 2008, 26 (1) :61-63.

[4]周奇, 张永光, 徐健健.基于直方图特性的图像去噪方法[J].电子测量技术, 2007, 30 (1) :40-42.

[5]向静波, 苏秀琴.基于数学形态学的金字塔图像去噪[J].光子学报, 2009, 38 (2) :458-460.

[6]李明喜, 吴鸿霞.基于小波变换和中值滤波的图像去噪方法研究[J].黄石理工学院学报, 2007, 23 (3) :16-19.

[7]马从兵.形态学滤波在压电陀螺信号处理中的应用[J].压电与声光, 2007, 29 (5) :527-529.

数学形态学处理 篇6

作物病害是指当健全的作物受到异常干扰后,导致器官和组织的生理机制出现局部的或系统的异常,并表现出了一定症状,具有危害面积大、种类繁多和形态变化大等特点。为了对作物病害进行早期预防和诊治,病害的自动识别成为热点研究内容之一。当作物发生病害时,通常会导致叶片上病斑的颜色和纹理表现不一[1],从而使得采用数字图像处理技术实现作物病害的自动分类和识别成为可能。

作物病害图像分类识别系统主要包括图像采集、图像预处理与图像分割、特征提取与选择、识别分类等4个环节。图像预处理是图像识别的第2个步骤,其目标是对质量欠佳的原始采集图像进行图像增强和图像复原,以便提取有价值的目标图像。

在图像预处理阶段应用数学形态学[2]是近年来数字图像处理领域研究的热点之一,其基本思想是运用特定形态的结构元素(如“探针”)去收集图像中的信息,并将图像中相对应的形状信息提取出来,最终识别作物病害图像,并将其归类。本文的研究目标是从复杂背景图像中提取最突出的小麦主体叶片图像,因此图像中的其它组成部分均可视为噪声。对于在大田复杂情况下采集的图像样本,其噪声面积大小、形状和位置各不相同,毫无规律,因此很难选择出通用的结构元素。然而,运算过程中,小麦叶片的边缘信息又对结构元素的形状和大小非常敏感,传统的数学形态学滤波器难以胜任图像噪声消除的任务。

1 图像边缘检测

在大田复杂环境下,不能量化外界的干扰因素,故不能有效地控制这些因素。在这种情况下,亮度和对比度对采集的图像影响比较明显。如果使用传统的边缘检测方法,其效果难以令人满意。此时,研究重点就是探索一种新的行之有效的边缘检测方法,从小麦图像中获得连续性较好的叶片边缘信息。基于这些信息,使用面积形态学的操作知识和原理将单个完整的小麦叶片从复杂背景下采集的原始图像中提取出来,为后续图像分割打下坚实基础。

传统的Sobel算子、Robert算子、Laplacian算子和Canny算子计算简单,但是对图像的噪声相对比较敏感,尤其是复杂背景下使用效果难以达到预期目标。相位一致性模型是一个无量纲的量,能够比较准确地进行特征定位,受图像亮度和对比度变化的影响非常小。此外,相位一致性模型与人眼视觉感受明暗变化的马赫带现象对应,具有强大的抗噪能力,能够提取和跟踪复杂背景下的目标。近年来,科研人员愈来愈趋向于使用相位信息来检测图像的边缘信息[3,4]。

首先,针对大田复杂背景采集小麦叶部病害图像,利用相位一致性算法,将叶部的灰度边缘从小麦叶部图像中提取出来;然后,使用非极大值抑制方法细化叶部的边缘特征线条,对边缘特征图像进行二值化,并连接边缘;再则,根据一个长度阈值将小于阈值的线段舍弃;最终,通过相位一致性信息实现小麦叶片边缘特征检测。处理结果见图1所示。

2 面积形态学基本运算

面积数学形态学[5,6,7,8]和传统数学形态学不同,它是以面积算子为研究基础,由于通常是由某一个连通区域所包含的像素总数目来决定图像中一个区域的面积,因此使用面积形态学算子处理图像之后,能够较好地保留图像的边缘信息。面积闭运算和面积开运算是面积数学形态学里包含的2个基本面积形态算子。

设M是二值图像集合,M1,M2,M3...Mn是M的连通区域,那么二值面积开运算[9]可以定义为

undefined

(i=1,2,3...n,λ≥0) (1)

式中 λ—一个给定的面积阈值。

对于图像中的连通区域,二值面积开运算就是去掉其像素值为1并且面积小于λ的连通区域,如图2所示。

同理,二值面积闭运算可被定义为

undefined

对于图像中的连通区域,二值面积闭运算就是去掉其像素值为0且面积小于λ的连通区域[10],如图3所示。

综上可知:如果能在区域填充时根据整齐的边缘特征信息来对二值图像进行操作,那么填充以后图像中最突出的小麦单个叶片必然是面积最大的连通区域;如果将它的面积作为面积阈值,对区域填充后的图像进行面积开运算,就可以从二值图像中完整地将最突出的单个叶片图像提取出来。

3 基于数学形态学的小麦病害图像预处理

3.1 形态闭运算

通过仔细观察采用相位一致性模型进行边缘检测的小麦病害图像样本,可以看出:在边缘位置处还依然存在大量的不连续信息,很多洞孔位于边缘的内部,使得叶片被划分成多个互相独立的连通部分;若直接对此图像运用面积开运算,那么预期效果与实际结果差别肯定很大,所以必须对边缘检测后的图像进行修补,并在后续中加强每个叶片边缘的封闭性和连续性[11]。

运用形态闭运算[12]可以在填充物体内细小空洞、连接邻近物体和平滑物体边界的同时使得物体面积不会发生明显改变。详细来说,就是用它来填补轮廓中的断裂部分,消除长细的鸿沟和小的孔洞,断开狭窄的间断。因此,可将其运用到叶片边缘裂缝的连接中,进一步强化小麦叶片边缘图像的连续性和封闭性。闭运算的定义为

B·S=(B⊕S)ΘS (3)

3.2 形态区域填充

小麦叶片边缘在形态闭运算后的状态应该是封闭的,但仍然有很多孔洞存在于叶片内部,并把叶片划分成了若干个连通的区域,这样对后续进行的面积开运算非常不利,所以必须填充叶片的内部,使其完整,从而为将完整的叶片从复杂的背景中提取出来奠定基础。

在以往的研究过程中,一般都利用形态闭运算来填充目标内部孔洞,但是这样会产生不好的结果,合并了原本完全不连通的两个连通分量。以上的步骤之中,使用形态闭运算填充内部空洞的时候,也有效地连接了叶片边缘裂缝。当叶片边缘处于封闭状态的时候,在轮廓线上出现多余的细线,但是依旧有很多孔洞位于叶片内部,此时若闭运算被继续执行,肯定会出现不必要的更多的连通区域,从而影响后面的处理工作。这个问题可以使用形态学区域填充技术来解决,即在集合的基础上进行补集运算、膨胀和交集。可以根据下面的迭代算法来运用结构元素B对二值图像集合A实现区域填充,即

undefined

第1步,在目标对象A中需要被填充区域的内部设置X0为初始点。根据结构元素B对X0进行膨胀运算,并取膨胀结果的补集与目标对象A做交集运算,得到的结果为X1。根据式(4)进行迭代运算,直到Xk=Xk-1,即在第k步迭代运算停止。算法的实质是取目标对象边界内的一个点,运用4连通或8连通的运算规则,逐个填充整个目标对象区域。在形态区域运算填充结束后,不难看到图像中的每个目标对象区域也都被填充了。本文关注的重点是突出目标叶片,区域中间不再有孔洞存在。

3.3 形态开运算

在完成形态闭运算和形态区域填充运算以后,发现小麦叶片图像的边缘还存在不光滑的现象,出现了许多毛刺,还需要对其进一步完善处理,使小麦叶片边缘更加完整和光滑。形态开运算[12] 能够去掉细的突出,使图像轮廓变得平滑,因此本文用开运算对上述步骤处理后的图像再次处理,期望去掉细的突出和孤立点,得到比较令人满意的结果。开运算的定义为

B。S=(BΘS)⊕S (5)

3.4 形态面积开运算

虽然按照上述的操作可以得到较好的边缘检测效果,然而对于图像中的突出目标叶片,其他噪声块还显得相对较为分散。按照以上步骤处理后,可以完全填充突出目标叶片的内部,构成一个最大的连通成分。由于它在面积图像中的面积比任何其他噪声连通成分的都大,从而使其与其它噪声互相独立,互不干扰。这样运用面积开运算使得从复杂的环境背景图像中提取出单个小麦突出目标叶片成为了可能。

在本研究中,赋予图像的每个连通成分各自的连通标记,并根据连通成分的面积将其按顺序排列。面积阈值的值就取其中最大的那个连通成分的面积。据此对图像进行面积开运算,这样就可以在前景中保留最大面积区域,而去除掉小于面积阈值的其它连通区域,从而将单个突出的小麦叶片从图像中预提取出来。图4给出了提取小麦单叶片图像的完整处理过程,其基础是相位一致性模型边缘检测结果和数学形态学。

4 小麦叶片提取结果验证分析

在图4基础上,利用上述的方法通过原图与图4(d)做乘法可以把叶片部分整体还原为彩色图像,可以将小麦叶片从复杂背景下单个突出的提取出来。依据以上研究,本文对几种不同角度拍摄的复杂坏境小麦叶部病害图像进行了提取,结果如图5所示。

从图5可以看出,原始图像的形状与噪声大小差异很大,但是通过预处理后保留了主体叶片上的细节及其边缘信息,其余噪声基本都被消除了,效果令人满意。

5 结语

本文针对在大田复杂的背景环境下采集的小麦叶片病害图像,运用数学面积形态学和相位一致性的模型构建了相应的预处理方法,并针对不同角度拍摄的图像,有效消除了原始图像的各种噪声,实现了主体叶片的完整提取,并能够保留原始病害图像中的病害细节信息,图像清晰完整。该方法理论完备,算法快捷,处理结果为后续病害特征的提取和诊断打下了坚实的基础。

参考文献

[1]赖军臣,李少昆,明博,等.作物病害机器视觉诊断研究进展[J].中国农业科学,2009,42(4):1215-1221.

[2]Serra.J.Image analysis and mathematical morphology[M].London:Academic Press,1982.

[3]袁海东.基于梯度和相位信息的低层视觉特征检测技术研究[D].北京:北京邮电大学,2008.

[4]XIAO Z T,HOU ZX.Phase based feature detector consistentwith human visual system characteristics[J].Pattern Recog-nition Letters,2004,25(10):1115-1121.

[5]Vincent L.Morphological area openings and closings forgrayscale images[C]//Proceedings of NATO shape in Pic-ture Workshop,Driebergen.Netherlands:Springer-Verlag,1992.

[6]Salembier P,Serra J.Flat zones filtering,connected opera-tors and filters by reconstruction[J].IEEE Transactions onImage Process,1995,4(8):1153-1160.

[7]Acton S T,Mukherjee D P.Area operators for edge detection[J].Pattern Recognition Letters,2000,21(8):771-777.

[8]Meijster A,Wilkinson M H F.A comparison of algorithmsfor connected set openings and closings[J].IEEE Transac-tions on Pattern Analysis and Machine Intelligence,2002,24(4):484-494.

[9]高海.数学形态学面积算子的快速算法和图像分割[D].北京:中国科学院声学研究所,2008.

[10]黎燕,樊小平,李刚.自动面积梯度分割算法及其在耳形图像中的应用[J].计算机工程与应用,2006,42(6):55-57.

[11]程军娜,姬光荣,冯晨.基于数学形态学的藻细胞图像预处理[J].中国海洋大学学报,2008,38(3):513-516.

数学形态学处理 篇7

随着信息技术的发展,人们越来越愿意通过信息技术来解决日常工作中遇到的繁重和重复的问题。车辆牌照的识别技术是图像处理和图像识别在交通领域重要的应用,车辆牌照的准确定位是识别技术中的关键,也是本文重点讨论的对象,它主要包括两方面的工作:首先是对抓取到的车辆的图片进行图像预处理,运用数字图像处理技术进行图片格式的识别、灰度化、边缘检测、膨胀腐蚀、二值化[1,2]等处理。其次是利用不同的算法在已经处理好的图片上准确地定位出车牌的位置,并将车牌位置从整幅图片中分割出来,为下一步的字符切割做好准备。

1 车牌定位

1.1 车牌的特征

车辆牌照本身具有明显的特征,目前我国现行的GA36-2007标准规定了车辆牌照统一特征参数:

(1)颜色:蓝底白字、黄底黑字、白底黑字(红字)。

(2)尺寸:车牌外轮廓为440 mm×140 mm的矩形,字符高度90 mm、宽45 mm,字符间隔12 mm,间隔符宽10 mm。

(3)字符:共7个字符,首字为汉字,代表省份,紧跟着的字符代表城市,后面5位字符是数字和字母的组合,其中字母不超过两位。

通过以上参数可以看出,车牌具有明显的字符纹理特征,有很密集的字符边缘,有统一的外轮廓尺寸,有固定的字符密度。本文主要是基于对外轮廓的宽高比与车牌内部的平均灰度来判定车牌定位是否准确。

1.2 车牌定位的主要工作

车牌定位工作主要是从拍摄的车辆图片中找到车牌的准确位置,由于不同车辆本身的不确定因素很多,这给车牌定位造成了很多困难,为了克服这些不利因素,人们依据车牌的不同特征提出了不同的车牌定位方法,按照原理基本可以分为3类,即基于颜色信息的方法[3]、基于神经网络的方法和基于水平或垂直投影的方法,这3种方法在计算量和环境的适应性方面各有利弊。本文提出了一种环境适应能力较强的车牌定位方法,它克服了车辆颜色的干扰,同时也减少了图像处理的计算量。

2 基于边缘检测和形态学处理的车牌定位算法

2.1 图像的预处理

对图片格式的识别,无论是jpg还是bmp格式的图片都要先读取到矩阵中去,如果图片是彩色的话要将其转化为灰度图像[4],将彩色图片转为灰度图像的公式为:

Gray=0.3R+0.59G+0.11B 。 (1)

其中:Gray代表图像的灰度,R、G、B分别代表彩色模型中红、绿、蓝3个颜色的分量值。

在灰度图像的基础上做top-hat变换,使阴影的细节增强。

2.2 边缘检测

到目前为止,边缘检测最通用的方法是检测亮度值的不连续性。在本次仿真中采用的是Sobel边缘检测器,Sobel边缘检测器使用式(2)和式(3)中的掩模来数字化地近似一阶导数值Gx、Gy:

undefined。 (2)

undefined。 (3)

2.3 形态学处理

在边缘检测和形态学处理之间进行了二值图像的逻辑运算,包括水平方向的噪声去除和消除孤立的亮点,这两个步骤是通过对图像的亮度矩阵行方向的运算和逻辑判断来实现的,这对于实现以形态学为基础的图像处理算法是一种有力的补充手段。在以下4个形态学处理公式中,A代表要被处理的集合,B代表处理中使用的结构元素,在本文随后的应用中A即代表了样本图像,B即为处理中使用的结构元素。形态学处理包括膨胀与腐蚀,膨胀最简单的应用之一是将裂缝桥接起来,对集合z中的集合A和B ,A被B膨胀可定义为:

undefined。 (4)

而腐蚀的一种最简单的用途是从二值图像中根据尺寸消除不相关的细节,对集合z中的集合A和B,使用B对A进行腐蚀,定义为:

A⊖B={z|(B)z⊆A} 。 (5)

膨胀使图像扩大而腐蚀使图像缩小。开操作一般使对象的轮廓变得光滑,断开狭窄的间断和消除细的突出物。闭操作同样使轮廓线更光滑,但是与开操作相反的是,它通常消弥狭窄的间断和长细的鸿沟,消除小的孔洞,并填补轮廓线中的断裂。使用结构元素B对集合A进行开操作,定义为:

A。B=(A⊖B)⊕B 。 (6)

因此,用B对A进行开操作就是用B对A腐蚀,然后用B对结果进行膨胀。使用结构元素B对集合A进行闭操作,定义为:

A·B=(A⊕B)⊖B 。 (7)

2.4 车牌的校正和准确定位

在形态学处理之后已经可以初步确定车牌的位置了,为了能够准确地切割字符,还需要对车牌的灰度图像进行几何校正和精确的定位。这里的几何校正主要指的是角度的旋转,原理是使用Hough变换对边缘检测的图像进行处理。Hough变换可以检测出边缘图像中共线的点的集合,再通过求这个集合中的峰值,也就是图像中最长的一条直线的角度,就得出了车牌的偏移角度,最后根据这个角度对图像进行水平的旋转就可得到几何校正的图像。准确定位的基本原理是检测水平方向的跳变,因为有字符的区域跳变会突然增多,这个跳变次数突然增多的位置就是车牌中字符的上边缘,同理可以检测到下边缘。通过这样的检测达到了精确定位的目的。

3 仿真结果与分析

仿真实验采用的是AMD Turion (tm) 64×2处理器和Windows XP操作系统,使用MATLAB 7.0软件[5],对样本图像进行处理。从仿真实验的运算速度考虑,本文对数码相机采集的图像进行了剪裁,使其长度和宽度都不超过1 000像素,这样不仅可以使仿真的速度加快,而且还能降低以后硬件开发时的设备成本。

仿真的具体过程如下:首先使用数码相机采集车辆正面的图像并进行剪裁,并经灰度处理得到了样本的灰度图像,如图1所示,在灰度图像的基础上进行边缘检测,得到了图像中主要的轮廓,如图2所示;随后进行去噪处理,即top-hat变换、白点消除、行去噪,图3为经过top-hat变换的图像;去噪后要进行形态学处理,即膨胀、开操作、闭操作,图4为闭操作仿真图像;从图4可以看出已基本实现了车牌的初步定位,沿着图4的亮度边缘坐标切割得到了图5。同时对切割后的车牌图像做边缘检测,这是为随后几何校正所使用的Hough变换做准备,初步定位的边缘图像见图6;Hough变换检测出偏移角度后对车牌进行校正;之后开始进行车牌的精确定位,准确定位的基本原理是检测水平方向的跳变,因为有字符的区域跳变会突然地增多,将图6水平方向的灰度相加得到图7;观察图7,可以得出初步定位的图像上、下边缘大概有5个~10个像素是没有亮度的,精确定位的目的就是去掉这些没有字符亮度的区域,得到的精确定位的图像如图8所示,图9为二值化处理得到的图像。将图9进行垂直投影,得到图10。从图10中可以看出字符的亮度分布,并用其来完成随后的字符分割任务,同时也证明了这种车牌定位方法达到了字符分割的要求。

4 结论

通过仿真,验证了通过边缘检测和形态学处理这种方法来完成车牌定位是可行的。此外应用本文算法对多个样本进行了实验,从效率和准确率来看也是较好的。本方法可作为车牌定位的一个基本的思路,在此基础上扩展使其能够满足多种条件多种车牌的定位和识别。

参考文献

[1]阮秋琦.数字图像处理(MATLAB版)[M].北京:电子工业出版社,2005.

[2]阮秋琦,阮宇智.数字图像处理[M].第2版.北京:电子工业出版社,2007.

[3]任文龙,张晓航,巨永锋.一种新的基于边缘检测的车牌定位方法[EB/OL].[2008-10-24].http://www.paper.edu.cn

[4]陈德富,何通能.车牌识别的嵌入式系统研究[D].杭州:浙江工业大学,2006:9-10.

数学形态学处理 篇8

随着计算机技术和现代测量技术的不断发展,机器视觉技术在最近三十年中得到了迅猛的发展,其应用遍及工业、农业、科学研究、军事等各个领域[1]。而虚拟仪器作为目前仪器领域发展的新方向,是计算机软、硬件技术与仪器技术融合的产物。把先进的虚拟仪器技术应用于机器视觉系统将给原有的系统带来前所未有的灵活性、一致性、可靠性和高效率。

形态学图像处理应用在非线性图像处理技术中,为大量的图像处理问题提供了一种一致的强有力方法。形态学图像处理思想是基于通过一小块形状或模板(结构元素)来处理图像。结构元素将被放置在图像中所有可能的位置,并且根据图像内容和结构元素之间的联系进行某种操作。在此,可以通过使用不同形状的结构元素执行一项具体任务,也可以在结构元素和图像之间定义各种各样不同的处理关系。形态学图像处理通常应用在二值图像上,同时此方法也可以延伸到灰度级图像[2]。

1 形态学图像处理原理

结构元素可以用元素由0或1组成的矩阵形式表示。结构元素的大小由矩阵的维度定义,并且结构元素的形状由矩阵中元素0和1的组合样式确定。

结构元素需要有一个原点。类似卷积过程,形态学操作将导致某一运算结果,该结果取自图像像素点对应于当前位置结构元素原点。因此,结构元素一般被定义为奇数维度,并且矩阵的中心通常被定义为结构元素的原点。

1.1 基本形态学操作

基本的形态操作是腐蚀和膨胀两种运算。大多其它形态学算法都是以这两种原始运算为基础。

使用结构元素s对图像f的腐蚀可由以下规则定义

undefined

腐蚀过程可表示为g=f⊗s。如此,连续的放置结构元素的原点到所有可能的图像像素点位置来检测图像,当结构元素完全地被包含在图像中(即适合)时输出为1,否则输出为0。

利用从原始图像中减去腐蚀后图像方法,腐蚀算法可实现对二值图像的边缘检测。由于被腐蚀的图像将失去原始的图像的边界像素,相减的结果将得到边界。因此可以通过g=f(f⊗s)实现边界提取。

使用结构元素s对图像f的膨胀可由以下规则定义

undefined

膨胀过程可表示为g=f⊕s。如此,连续的放置结构元素的原点到所有可能的图像像素点位置来检测图像,当结构元素和图像有一个非0交叉点(即结果元素击中)时输出为1,否则输出为0。

虽然腐蚀和膨胀算法其思想是固定的,但结构元素的形状和大小的不同无疑将影响形态过程的结果。因此,针对具体应用使用适当的结构元素形状和大小,可改进图像处理性能。腐蚀和膨胀单独运用其用途是有限的,但更加有效的形态学操作却可通过结合这两种基本操作来实现。

1.2 二值形态学

除了二种基本的腐蚀和膨胀操作之外,通过腐蚀和膨胀的组合可获得其它的形态操作。

开操作定义为先腐蚀再膨胀。使用结构元素s对图像f的开操作可表示为f。s,其表达为以下形式

gopen=f。s=(f⊗s)⊕s (3)

开操作具有消除小和细的对象,使大对象的轮廓变得光滑且不改变其基本外观,同时断开狭窄的间断的作用。

闭操作定义为先膨胀再腐蚀。使用结构元素s对图像f的闭操作可表示为f·s,其表达为以下形式

gclose=f·s=(f⊕s)⊗s (4)

闭操作具有填充对象中小和细的孔,连接临近的对象,通常使大对象的轮廓变得光滑且不改变其基本外观的作用。

结合腐蚀和膨胀可实现击中或击不中变换,在形态学中此变换是形状检测的基本工具。击中或击不中变换使用两个不同的结构元素(分别与对象和背景有关)同时检测对象的内部和外部。对于图像中某一像素点,如果第一个结构元素认为该点适合对象,并且第二个结构元素认为该点不适合对象(即适合在对象之外图像区域),则该像素属于对象。击中或击不中变换可表达为以下形式

ghit-miss=(f⊗shit)/(f⊕smiss) (5)

此处“/”代表集合区别。

细化操作可实现腐蚀并不会打断对象。细化通过两个步骤完成:第一步是标记所有可去除的候选像素,第二步将不破坏连通性的已标记像素去除。细化可表示和理解为在原图像和击中或击不中变换结果之间的区别。

gthin=f/ghit-miss=f/((f⊗shit)/(f⊕smiss)) (6)

粗化操作可实现膨胀并不会合并附近对象。粗化通过相似于细化的两个步骤完成。粗化可表示和理解为原图像和击中或击不中变换结果的联合。

gthick=f∪ghit-miss=f∪((f⊗shit)/(f⊕smiss)) (7)

此处“∪”代表集合联合。

形态操作譬如开操作和闭操作可看作从图像中去除不受欢迎的特点的形态过滤器。由于形态操作通过结构元素的形状起作用,它们亦可被看作形状过滤器。

2 LabVIEW中形态学图像郸理实现

2.1 虚拟仪器图像处理系统软件配置

数字图像处理是计算机视觉系统的核心,在虚拟仪器系统中这一切是通过软件来实现的。所以软件部分就是其核心,它由开发平台、应用软件包和设备驱动程序组成。本系统采用了LabVIEW7.1作为系统的开发平台。一方面,因为NI公司的IMAQ Vision软件将机器视觉和图像处理功能集成在LabVIEW之中;另一方面,充分利用它快速显示、分析、处理的图形界面功能,进行数值分析、信号处理和设备驱动,满足系统的功能要求,提高工作效率。

IMAQ Vision为虚拟仪器平台提供了完整的图像处理函数库和功能模块,包含一系列MMX优化函数,提供了大量科研和工程中常用的图像采集和处理功能,例如各类边缘检测算法、自动阈值处理、各种形态学算法、滤波器、FFT等[3,4,5]。

2.2 形态学图像处理实现

按照形态学图像处理程序的功能结构的划分,在LabVIEW程序设计中分别编制了如下几个模块:

(1)图像加载模块

图像加载模块用于向系统提供原始图片数据并进行预处理。该模块可加载磁盘上的图像文件,也可通过图像采集卡、USB或1394摄像头等图像采集设备获取图像。为了便于进行形态学图像处理,还需将加载的图像转换为二值图像或灰度图像。

(2)图像处理模块

图像处理模块是处理软件的核心部分。利用IMAQ Vision提供的形态学图像处理函数,配置不同的输入参数,实现上文的各种处理算法[6]。其程序结构框图如图1所示。

(3)图像存储模块

图像存储模块将处理后的图像和数据保存到磁盘。其实质是通过图像处理模块的矩阵运算后,将结果矩阵数据再转化为适当的图像文件存储结构并进行保存。

3 形态学图像处理实例

本软件系统,实现了对图像的形态学处理算法,运算速度快且结果正确,具有良好的人机图形化界面。对基本算法腐蚀和膨胀进行了实例说明并给出结果。

3.1 腐蚀

对一副二值图像,分别采用3×3正方形结构元素腐蚀和5×5正方形结构元素腐蚀。如图2(a)(b)(c)所示。

3.2 腐蚀用于边缘检测

原图像减去腐蚀图像,实现对象的边缘检测。如图3(a)(b)(c)所示。

3.3 膨胀

对一副二值图像,分别采用3×3正方形结构元素膨胀和5×5正方形结构元素膨胀。如图4(a)(b)(c)所示。

4 结束语

在LabVIEW以及IMAQ Vision虚拟仪器软件平台上,研究实现了形态学图像处理算法,开发了具有模块化结构的图像处理软件,为其他图像处理方法的应用打下基础。利用虚拟仪器技术的功能强大、扩展性强等特点,同时利用LabVIEW的开放,高度的编程灵活性和良好的界面,使高级复杂的应用开发变得简单。基于虚拟仪器的图像视觉系统在测试测量与控制领域有着极广的应用前景。

参考文献

[1]毛义梅.虚拟仪器视觉系统的设计与实现[J].仪器仪表学报,2002,23(3):192-193.

[2]Castleman K R,数字图像处理[M].朱志刚,等译.北京:电子工业出版社,1998.

[3]李华.基于虚拟仪器技术的图像采集系统构成探讨[J].苏州丝绸工学院学报,2001,21(3):27-32.

[4]张嘏伟,等.虚拟仪器的计算机视觉系统设计研究与应用[J].微计算机信息,2005,21(11):136-138.

[5]金昊.基于虚拟仪器的计算机视觉系统的研究[J].电子技术应用,2000(4):10-12.

数学形态学处理 篇9

手部识别属于模式识别问题,其中涉及图像处理和特征提取操作。由于手部识别的应用范围广阔,许多学者及研究机构都在对此进行研究。

在已有的研究成果和算法中,最常使用的方法是机器视觉技术[1],很多研究者通过诸多不同的机器视觉技术实现了精确有效地手部识别。Bhuyan.M.K等人提出一组新的描述手部连续姿态的特征集[2]。郭训力等人提出一种融合肤色模型和三维深度信息的手部识别方法[3]。覃文军等人提出了通过手部形状特征检测的手势感兴趣区提取方法[4]。魏来等人利用Kinect的关节点信息和肤色颜色模型提取出手部区域[5]。柴功博等人提出一种基于手掌分割的摄像机阵列手部定位技术[6]。DE.STEFANO.C等人将遗传算法应用于模式识别中对手部图像的处理[7]。此外,还有通过外部设备获取生物电信号实现手部识别的方法,如郭一娜等人提出一种基于肌电信号与柔性神经树(Flexible Neural Trees)FNT模型的实时手势识别模型[8]。

以上这些算法都过于复杂,不利于工程实现。本文意在寻找一种简单且复杂度较低的算法来解决手部的识别问题。本文根据手部与周围背景在RGB颜色分量上的差异,对彩色图像阈值变换所得到的二值图像,进行开闭操作及特征提取,最后完成手部的识别过程。实验结果表明,该方法能够较为有效地实现手部与周围背景的分割。

1 数据来源

这里手动采集了27幅手部图像,其中包含了男性和女性样本,年龄在18~20岁之间,摆出不同的姿态。图1给出了数据库的4幅示意图。

2 方法

本文方法分为3个步骤如图2所示。在采集原始手部图像后,首先通过多通道阈值分割,得到二值图像;接着通过形态学操作,填充孔洞;最后通过模式识别方法,去除图像中的孤立点集,此时得到的就是最终的分割图像。

2.1 基于通道的阈值分割

物体表面的颜色即表面色是因光照而呈现的颜色[9]。在自然光照射及其他因素的影响下,手部和其他物体形成不同的表面色,且推测手部表面色会处于某个色彩范围内,本文正是利用手部和周围环境在RGB颜色分量上的差异进行识别。截取样本图像中的感兴趣区域ROI(Region of Interest),即图像中的手部部分,对其进行RGB颜色分量统计,得到颜色分量直方图,如图3所示。可见,手部图像在RGB颜色分量直方图上均存在波峰,可进一步划分彩色阈值。

由上述颜色分量直方图可得出手部的RGB颜色分量分布区域,根据这些信息将图像二值化。设R(m,n),G(m,n),B(m,n)分别代表(m,n)处的R、G、B分量值,而bw(m,n)代表该点的二值化值,则:

2.2 形态学操作

彩色阈值分割后,手部可能会因为表面纹理造成图像中存在孔洞,所以,对变换后的二值图像先进行孔洞填充操作。然后,以白色手部区域为前景,其余黑色部分为背景,对得到的二值图像进行闭运算,闭运算即先膨胀再腐蚀的结果,将图像中狭窄的缺口连接起来,并填充比结构元素小的洞,平滑对象的轮廓。进行闭运算后,再进行一次孔洞填充,补完图像。

2.3 模式识别

在孔洞填充之后,图像中还有可能出现孤立的局部点集,这是由于拍摄时受噪声影响。为此,将所有互相连接的点集标号,提取对应的特征,建立规则选取符合手部图像的点集。

图像特征是指图像中可以用来标志的属性[10],在其提取过程中,一般包括面积、周长、重心等。对手部图像进行特征提取,考虑到手指部分的形状,整个手部的周长面积比会与其他物体有所区分,所以根据周长面积比将手部从背景中提取出来。

面积:指物体区域包含的像素数,用符号s表示。

周长:物体轮廓线上像素间距离之和,用符号c表示。在进行周长计算时,需根据像素间的连接方式,分别计算距离。像素间距离可分为并列连接像素与倾斜连接像素2种方式。并列有上下左右4个方向,像素间距离为1;倾斜方向有左上角、左下角、右上角、右下角,其像素间距离等于单位正方体的对角线长度。本文使用8向链码求二值图像的周长。周长面积比用r表示,有r=c s。

表1是对实验数据提取得到的周长面积比统计。

表中数据0.048 276偏差较大,是由于取样过程中,拍摄样本图片角度过于倾斜导致。排除异常数据后,表中周长面积比的最小值min=0.067 697,最大值max=0.110 470,据此设置手部提取的特征参数区间。若用h代表手部,1和0分别代表该对象被保留或舍弃,则定义手部提取公式为:

3 实验

编程语言采用Matlab 2014a,在主频为3 GHz、CPU为Intel Core i3、内存为8 GB的HP Pavilion g6笔记本电脑上运行。这里设计了如下3个实验任务。限于篇幅,选择以图4(a)为例,详细描述本文算法的每一步结果。

3.1 预分割二值图像

基于RGB三通道得到的手部预分割的二值图像如图4(b)所示,可见式(1)能够有效地初步提取彩色手部图像。手部的大致边缘均包含在得到的二值图像内。缺陷在于,手部存在孔洞,同时背景部分存在独立点集。这将通过下述两个步骤予以校正。

3.2 孔洞填充

图44(cc)是对二值图像进行孔洞填充、闭运算、再次孔洞填充后得到的变换图。可见,经过形态学操作后,前景图像(手部)中的孔洞已较好的予以填充,能够完整地反映手部的形状。

3.3 去除孤立点集

对孔洞填充后的图像进行模式识别以去除孤立点集,得到最终结果如图4(d)所示。可见,此时得到的分割结果不仅在手部区域没有孔洞,而且在背景区域也没有孤立点集,较理想地完成了本文的设计任务。

4 结语

本文根据手部和背景在RGB颜色分量上的差异所提出的基于分量值的彩色阈值变换图像分割算法,较单色分量的阈值变换具有明显的优势。同时引入形态学操作与模式识别算法,能够较好地填充孔洞与去除孤立点集。实验结果显示该算法具有较高的准确率,能够很好地将手部从背景中提取出来。

本文方法的缺点在于,在采集的样本图像中有部分提取后偏差较大,尤其是背景色彩复杂、光照过强或过弱的样本,此次样本有限,未能做进一步分析。另外,算法评价过于主观,需要进一步采用客观的量化评价方法。今后的工作将继续完善本算法,考虑引入纹理特征和边缘检测,以进一步提高该算法的鲁棒性,保证该算法在各种条件下都能适用。

注:本文通讯作者为张煜东。

参考文献

[1]NOUAOURIA N,BOUKADOUM M.Improved global-best particle swarm optimization algorithm with mixed-attribute data classification capability[J].Applied Soft Computing,2014,21(2):554-567.

[2]BHUYAN M K,KUMAR D A,MACDORMAN K F,et al.A novel set of features for continuous hand gesture recognition[J].Journal on Multimodal User Interfaces,2014,8(4):333-343.

[3]郭训力,俞扬.一种基于肤色和深度的第一人称人手识别方法[J].计算机工程与应用,2014(12):133-136.

[4]覃文军,杨金柱,赵大哲.基于形状特征检测的手势感兴趣区提取方法[J].机器人技术与应用,2012(6):39-41.

[5]魏来,王迪,邢程,等.基于kinect的手指定位[J].电脑知识与技术,2014(28):6713-6715.

[6]柴功博,顾宏斌,吴东苏,等.基于手掌分割的摄像机阵列手部定位技术研究[J].仪器仪表学报,2012(11):2535-2545.

[7]DE STEFANO C,FONTANELLA F,MARROCCO C,et al.A GA-based feature selection approach with an application to handwritten character recognition[J].Pattern Recognition Letters,2014,35(2):130-141.

上一篇:超市经营下一篇:红外线电子防护网设计