直方图法

2024-08-16

直方图法(精选7篇)

直方图法 篇1

摘要:针对牛羊眼部纹理信息提取前需要对牛羊眼部图像进行增强处理的问题,采用对比度受限直方图均衡化方法对牛羊眼部图像进行增强处理。该算法首先将原始图像分割成若干个大小相同的子区域,再计算截取值对每个子区域的直方图进行截取,并将截取下的像素均匀分配到每个灰度级,得到限定对比度直方图,根据限定对比度直方图对原图进行灰度双线性插值生成增强图像。实验结果表明,使用对比度受限直方图均衡化方法对牛羊眼部图像进行增强处理,增强后的图像具有更高的图像细节和层次感,同时减少了图像的失真,具有较高的理论和实用价值。

关键词:图像增强,直方图均衡,对比度受限直方图均衡化,牛羊眼部图像

肉类食品的可溯源性已成为严重制约清真牛羊肉食品出口的一个重要环节,将眼部特征识别技术应用在畜牧业生产及牲畜产品溯源过程中,将成为一个新的研究方向。由于牛羊眼部结构和人类眼部结构不同,对牛羊眼部纹理信息提取前需要对牛羊眼部图像进行增强处理。图像增强处理方法有很多种,如直方图处理方法[1]、Retinex[2]、同态滤波[3]、空域彩色图像增强方法和暗通道先验等算法。

1 直方图均衡法

直方图均衡化是图像增强算法中最常用、最重要的算法之一。直方图均衡化的基本思想是把原始直方图变换为均匀分布的形式,从而增加像素灰度值的动态范围达到增强图像整体对比度的效果。

空域是指由像素组成的空间,空域增强方法指直接作用于像素的增强方法,可表示为:

累积分布函数满足上述两个条件能将s的分布转换为的均匀分布:

根据原图像直方图及式(4)可直算出直方图均衡化后各像素的灰度值。

离散的灰度等级作直方图均衡化时,很难得到完全平坦均匀的结果,而且处理后的图像灰度级有所减少,致使某些细节消失。某些图像,如直方图有高峰等,经处理后其对比度易产生不自然的过分增强。

2 对比度受限自适应直方图均衡法

对比度受限自适应直方图均衡法又称为CLAHE算法,是由直方图均衡算法演化发展而来。为了克服上述自适应直方图均衡算法的局限,Reza A等人提出了对比度受限自适应直方图均衡化(Contrast Limited Adaptive histogram equalization CLAHE)算法。对比度受限自适应直方图均衡法(CLAHE)通过限制局部直方图的高度来限制局部对比度的增强幅度,从而限制噪声的放大及局部对比度的过增强。该方法通过将图像分为若干子区域;然后对每个子区域进行直方图“剪切”。然后对每个子区域进行直方图均衡,再对每个像素通过插值运算得到变换后的灰度值,从而实现对比度受限自适应图像增强。

该文根据牛羊眼部图像的特点,将对比度受限自适应直方图均衡法部分改进后,应用于牛羊眼部图像的增强处理。

处理基本流程:

(1)将原图分割为k个大小为m×n的连续不重叠的子区域。跟据牛羊眼部图像情况动态调整m,n值大小。

(2)计算每个子区域的灰度直方图。

(3)确定每个子区域灰度直方图“剪切”值。

首先由式(5)计算每个子区域内像素个数平均分配到每个灰度级的平均值:

式中Nclip是截取限制系数,含义是限定子区域每个灰度级所包含像素数不超出平均像素数的倍。

(4)剪切每个子区域的灰度直方图,余下来的像素数目重新分配到各直方图的各灰度级中,设已被剪切的像素总数为,每个灰度级均分的剪切像素数为。

采用以下方法重新分配:

其中为原始区域中的第i个灰度级的像素个数。

(5)设经过以上重新分配后,剪切下来像素点剩余数为。用灰度范围长度除以剩余像素数(8),求出“分配像素”步长S。

从最小灰度级开始按步长搜索,遇到像素数小于“剪切”值的位置,则分配一个像素,完成从最小灰度级到最大灰度级的循环后,如果还有剩余的像素没有分配完,则利用式(8)计算新的步长,再开始新的循环,直到剩余的像素“分配”完为止。从而得到新的灰度直方图。

(6)对每个子区域内对比度“剪切”后的灰度直方图进行均衡化。

(7)按照新的直方图分布,对图像进行灰度双线性插值,生成增强后的结果图像。

3 实验结果分析

该实验采用500万像素虹膜采集仪为奶牛和山羊提取眼部图像。在Matlab R2010b版本上对其进行仿真,验证CLAHE算法对牛羊眼部图像的增强效果。

该实验分别采用奶牛和山羊眼部图像进行直方图均衡化变换及CLAHE变换增强处理,其处理效果如图1所示。

图1中a为奶牛和山羊眼部图像的灰度图,b为经过直方图均衡化处理后的增强图像,c为经过CLAHE处理后的增强图像。

分析上述图像发现,经过直方图均衡化处理的会引起过度增强,引入大量噪声的情况,如奶牛眼部图像中虹膜左上角增强及山羊眼部图像中虹膜内部增强,均出现了该情况。而CLAHE方法则适当的弥补了该缺陷,从实验结果可以看出,经过CLAHE处理后的增强图像没有过度增强,也没有出现失真现象,同时突出部分细节。

实验结果表明,使用CLAHE方法对牛羊眼部图像进行增强处理,具有更高的图像细节和层次感,同时减少了图像的失真,具有较高的理论和实用价值。

4 结语

该文为解决将眼部特征识别技术应用在畜牧业生产及牲畜产品溯源过程中,对牛羊眼部纹理信息提取前需要对牛羊眼部图像进行增强处理的问题,将对比度受限自适应直方图均衡法应用于牛羊眼部图像的增强处理。

参考文献

[1]李利荣,汪蒙.一种高效的图像增强去雾算法[J].湖北工业大学学报,2013(5):72-75

[2]林笑君,梁凤梅.基于Retinex的一种图像去雾算法[J].电视技术,2013(17):155-158.

[3]康艳梅,陈名松,何志毅.基于LED辅助照明的水下图像增强算法研究[J].电视技术,2013(15):211-214.

直方图要点精讲 篇2

要点一,组距、频数与频数分布表的概念 .

1.组距:每个小组的两个端点之间的距离(组内数据的取值范围).

2.频数:落在各小组内数据的个数.

3.频数分布表:把各个类别及其对应的频数用表格的形式表示出来,所得表格就是频数分布表.

要点诠释:

( 1) 求频数分布表的一般步骤: 1计算最大值与最小值的差; 2决定组距和组数; 3确定分点; 4列频数分布表;

( 2) 频数之和等于样本容量.

( 3) 频数分布表能清楚、确切地反映一组数据的大小分布情况,将一批数据分组,一般数据越多,分的组也越多,当数据在100个以内时, 按数据的多少,常分成5 ~ 12组,在分组时,要灵活确定组距,使所分组数合适,一般组数为最大值-最小值/组距的整数部分+1.

要点二,频数分布直方图 .

1. 频数分布直方图: 是以小长方形的面积来反映数据落在各个小组内的频数的大小,直方图由横轴、纵轴、条形图三部分组成.

( 1) 横轴: 直方图的横轴表示分组的情况( 数据分组) ;

( 2) 纵轴: 直方图的纵轴表示频数;

( 3) 条形图: 直方图的主体部分是条形图,每一条是立于横轴之上的一个长方形、底边长是这个组的组距,高为频数.

2. 作直方图的步骤:

( 1) 计算最大值与最小值的差;

( 2) 决定组距与组数;

( 3) 列频数分布表;

( 4) 画频数分布直方图.

要点诠释: ( 1) 频数分布直方图简称直方图,它是条形统计图的一种.

( 2) 频数分布直方图用小长方形的面积来表示各组的频数分布, 对于等距分组的数据,可以用小长方形的高直接表示频数的分布.

3. 直方图和条形图的联系与区别:

( 1) 联系: 它们都是用矩形来表示数据分布情况的; 当矩形的宽度相等时,都是用矩形的高来表示数据分布情况的;

( 2) 区别: 由于分组数据具有连续性,直方图中各矩形之间通常是连续排列,中间没有空隙,而条形图中各矩形是分开排列,中间有一定的间隔; 直方图是用面积表示各组频数的多少,而条形图是用矩形的高表示频数.

要点三,频数分布折线图 .

频数分布折线图的制作一般都是在频数分布直方图的基础上得到的,具体步骤是: 首先取直方图中每一个长方形上边的中点; 然后再在横轴上取两个频数为0的点( 直方图最左及最右两边各取一个,它们分别与直方图左右相距半个组距) ; 最后再将这些点用线段依次连接起来,就得到了频数分布折线图.

二、热点考点聚焦

1.组距、频数与频数分布表的概念

例1 ( 1) 对某班50名学生的数学成绩进行统计,90 ~ 99分的人数有10名,这一分数段的频数为______.

( 2) 有60个数据,其中最小值为140,最大值为186,若取组距为5,则应该分的组数是______.

解析: ( 1) 利用频数的定义进行分析; ( 2) 利用组数的计算方法求解. 答案: ( 1) 10 ( 2) 10.

点评: 组数的确定方法是,设数据总数目为n,一般地,当n≤50时,则分为5 ~ 8组; 当50≤n < 100. 则分为8 ~ 12组较为合适,组数等于最大值与最小值的差除以组距所得商的整数部分加1.

2.频数分布表或直方图

例2 ( 2013年黔东南州中考) 为了解黔东南州某县2013届中考学生的体育考试得分情况,从该县参加体育考试的4000名学生中随机抽取了100名学生的体育考试成绩作样本分析,得出如下不完整的频数统计表和频数分布直方图.

( 1) 求a、m、n的值,并补全频数分布直方图;

( 2) 若体育得分在40分以上( 包括40分) 为优秀,请问该县中考体育成绩优秀学生人数约为多少?

分析: ( 1) 求出组距,然后利用37. 5加上组距就是a的值; 根据频数分布直方图即可求得m的值,然后利用总人数100减去其它各组的人数就是n的值;

( 2) 利用总人数4000乘以优秀的人数所占的比例即可求得优秀的人数.

解: ( 1) 组距是: 37. 5 - 32. 5 = 5,则a = 37. 5 + 5 = 42. 5;

根据频数分布直方图可得: m = 12,则n = 100 - 4 - 12 - 24 - 36 - 4 = 20;

( 2) 优秀的人数所占的比例是:36 + 20 + 4/100= 0. 6,

则该县中考体育成绩优秀学生人数约为: 4000 × 0. 6 = 2400( 人) .

点评: 本题考查读频数分布直方图的能力和利用统计图获取信息的能力; 利用统计图获取信息时,必须认真观察、分析、研究统计图,才能作出正确的判断和解决问题.

3.频数分布折线图

例3抽样检查40个工件的长度,收集到如下一组数据( 单位: cm) :

试列出这组数据的频数分布表. 画出频数分布直方图和频数折线圈.

分析: 利用频数分布直方图画频数折线图时,折线图的两个端点要与横轴相交,其方法是在直方图的左右两边各延伸一个假想组,并将频数折线两端连接到轴两端假想组的组中点,就形成了频数折线图.

解: 列频数分布表如下:

根据上表,画出频数分布直方图; 连接各小长方形上面一条边的中点及横轴上距直方图左右相距半个组距的两个频数为0的点得到频数折线图( 如图所示) .

点评: 本例分组采用了“每组端点比数据多一位小数”,即第一组的起点比数据的最小值再小一点的方法. 体会这种分组方法的优势,对我们今后的学习很有帮助.

4.综合应用

例4低碳发展是今年深圳市政府工作报告提出的发展理念,近期,某区与某技术支持单位合作,组织策划了该区“低碳先锋行动”,开展低碳测量和排行活动,根据调查数据制作了频数分布直方图( 每组均含最小值,不含有最大值) 和扇形统计图,下图中从左到右各长方形的高度之比为2∶ 8∶ 9∶ 7∶ 3∶ 1.

( 1) 已知碳排放值5≤x<7( 千克/平方米·月)的单位有16个, 则此次行动共调查了_____个单位;

( 2) 在图2中,碳排放值5≤x < 7( 千克/平方米·月) 部分的圆心角为________度;

( 3) 小明把图2中碳排放值1≤x <2的都看成1. 5,碳排放值2≤x <3的都看成2. 5,依此类推,若每个被检查单位的建筑面积均为10000平方米,则按小明的办法,可估算碳排放值x≥4( 千克/平方米·月) 的被检单位一个月的碳排放总值约为_______吨.

分析: ( 1) 先算出碳排放值在5≤x < 7范围内所对应的比例,再求一共调查了多少个单位;

( 2) 由碳排放值在5≤x < 7范围内所占的比例,可计算出圆心角度数;

( 3) 先计算碳排放值4≤x <5的单位、碳排放值5≤x <6的单位,碳排放值6≤x <7的单位个数,再算出碳排放值x≥4( 千克/平方米·月) 的被检单位一个月的碳排放总值.

解: ( 1) 16 ÷4/30= 120( 个) ,故填120;

( 2) 4 ÷ 30 × 360° = 48°,故填48;

( 3) 碳排放值x≥4( 千克/平方米·月) 的被检单位是第4,5,6组, 分别有28个、12个、4个单位,10000 × ( 28 × 4. 5 + 12 × 5. 5 + 4 × 6. 5) ÷ 1000 = 10 × ( 126 + 66 + 26) = 2180( 吨) .

所以,碳排放值x≥4( 千克/平方米·月) 的被检单位一个月的碳排放总值约为2180吨.

直方图均衡处理方法的研究 篇3

图像直方图是图像处理中一种十分重要的图像分析工具,它描述了一幅图像的灰度级内容,任何一幅图像的直方图都包含了丰富的信息,它主要用在图像分割,图像灰度变换等处理过程中。从数学上来说图像直方图是图像各灰度值统计特性与图像灰度值的函数,它是对图像中每一灰度值出现频率的统计,从图形上来说,它是一个二维图,横坐标表示图像中各个像素点的灰度级,纵坐标为各个灰度级上图像各个像素点出现的次数或概率。灰度直方图性质:(1)表征了图像的一维信息。只反映图像中像素不同灰度值出现的次数(或频数)而未反映像素所在位置。(2)与图像之间的关系是多对一的映射关系。一幅图像唯一确定出与之对应的直方图,但不同图像可能有相同的直方图。(3)子图直方图之和为整图的直方图。

直方图是对图像中每一灰度值出现的频率的统计,一幅图像的直方图基本上可描述图像的概貌,如图像的阴暗状况和对比度等特征都可以通过直方图反映出来。既然一幅图像的概貌可以通过直方图反映出来,反之,可以通过修改直方图的方法来调整图像的灰度分布情况,因为直方图反映的是一个图像的灰度值的概率统计特征,所以,基于直方图的图像增强技术是以概率统计学理论为基础的,直方图反映的是一个图像的灰度值的概率统计特征,常用的方法有直方图均衡化技术和直方图规定化技术

1 直方图均衡化原理

直方图均衡处理是以累计分布函数为基础的直方图修改法,就是把一已知灰度概率分布的图像经过一种变换,使之演变成一幅具有均匀灰度概率分布的新图像。如果一副图象的直方图是均衡的,则其概率密度函数为

L是图像灰度级的取仅范围,对于归一化的灰度级来讲,因为L1=l,所以Ps(s)=l。因此,上式可改写为ds=Pr(r)dr:

两边取积分有:

如果取变换函数

则可以将概率密度函数为pr(r)的图像变为具有均匀概率密度分布函数ps(s)的图像。由式(2-4)所表示的变换函数是原图像的累积概率密度函数,该函数满足前述变换函数的两个条件,将上述结论推广到离散数字图象。

设一幅图像的像元数为n,共有L个灰度级,nk代表灰废级为k的像元的数目,则第k个灰度级出现的概率可表示为:

式(4)中0≤rk≤1,0≤k≤L-1

所表示的变换函数T(r)可改写为:

式(6)中0≤rr≤1,0≤k≤L-1,其反变换为

2 直方图均衡化的优缺点

经过均衡化增强后图像,图像的亮度得到了提升,图像从整体上给人一种清晰的感觉。直方图均衡化以后图像的细节更清楚,而从图像的灰度分布上也可以看出,在调整前低灰度比例大,调整后各灰度等级达到平衡。由上述可知,直方图均衡化是利用累积分布函数作为灰度变换函数,经变换后得到的新灰度的直方图虽然不很平坦,但毕竟比原始图像的直方图平均得多,而且其动态范围也大大地扩展了。因此这种方法对对比度较弱的图像进行处理是很有效的。但是简单地将图像进行直方图均衡,会使得图像看起来亮度过高。

我们用灰度拉伸的方法从而提高图像的对比度,进而到达我们增强图像感兴趣区域目的。然而,一副图像中对我们研究有帮助的细节常常集中在很窄的部分。而退化后的图像混杂着很多的图像噪声,我们知道,从频率域角度来说,因为噪声对应的是高频分量,所以我们在使用直方图均衡处理方法进行拉伸的时候,势必会将图像噪声进行放大。另外,我们对图像用传统的直方图均衡处理方法进行处理的时候,从整体来看,是对整幅图像的每一个像素点都做同样的处理,从而达到对比度增强效果;但从局域来讲,因为此处理方法是根据灰度级出现概率的统计特性来的,对我们研究有帮助的那部分图像的灰度级出现的频率常常很少,而对我们的研究没有太大帮助的背景图像出现的频率常常很高,这样就会产生这样的后果,那就是由于背景图像的存在,使得我们感兴趣的那部分图像细节的灰度级出现一个简并现象,使得一部分目标细节图像丢失,为后面图像的后续处理带来困难。达不到理想的预期目的。从以上分析我们可以看出,传统的直方图均衡处理方法存在着以下两个缺点,即加强高频噪声和图像细节损失。

参考文献

[1]何东健.数字图像处理[M].西安电子科技大学出版社,西安,2003.

[2]毕侯捷.图像通信工程[M].北京:人民邮电出版社,1995.

[3]阮秋琦.数字图像处理[M].北京:电子工业出版社,2001.

[4]夏良正.数字图像处理[M].南京:东南大学出版社,1999

[5]许建华.图像处理与分析[M].北京:科学出版社,1992.

[6]赵荣椿,等.数字图像处理导论.西安:西北工业大学版社,1999.

[7]M.Runt.Second generat ion image coding techniques.Proceeding of the IEEE,1985,73(4):299-302.

直方图法 篇4

红外图像是热辐射成像,由于场景中的目标与背景的温差相对较小,红外图像的动态范围大、对比度低,信噪比也较可见光图像的低。为了能够从红外图像中正确地识别出目标,必须对红外图像进行增强处理[1,2]。直方图均衡(HE)[3,4,5]是一种常用的图像增强方法,它根据图像的直方图分布信息进行灰度调整,以达到增强图像的效果。但由于红外图像自身的特点,一般的直方图均衡增强算法不适用于红外图像。为了克服直方图均衡化算法存在的不足,近几年出现了很多新的基于直方图处理的图像增强算法,其中以平台直方图算法(PE)[6,7]最具代表性,该算法基本上解决了直方图均衡化提升红外图像背景的缺点,但算法需要选择一个合适的平台值。不同的红外图像平台值的选择一般不相同,目前基本上是凭经验进行平台值的选择,这样就限制了算法的应用。自适应平台直方图均衡[8]是一个解决这个问题的有效方法。

针对上述问题,本文提出了一种基于直方图的自适应红外图像增强算法。该算法根据原始图像的直方图,自适应地构造出一个加权函数对原始图像的直方图进行加权处理,然后采用加权后的直方图对原始图像进行直方图均衡化。实验结果表明,算法对红外图像具有较好的增强效果,能够有效地抑制图像的背景,突出目标。

2 常用的红外直方图增强算法

直方图均衡化(HE)算法是图像增强中最常用、最重要的算法之一。该算法是把一幅已知灰度概率分布的图像,经过点变换使原始图像变成具有均匀概率分布的图像,从而使信息熵最大。对可见光图像,直方图均衡能达到相当好的增强效果。对于红外图像,由于背景所占灰度级较大,目标所占的灰度级较小,经过直方图均衡后,像素数多而且分布密集的背景灰度级之间的间隔变大,对比度得到了提高;像素数少、分布较稀疏的目标的间隔变小。这样反而提升了背景的对比度,减小了目标的对比度。因此直方图均衡(HE)增强算法不适用于红外图像增强。

平台直方图均衡(PE),是对直方图的一种修正。该算法通过选择一个合适的平台阈值P,在对图像直方图统计时,做如式(1)所示的修正。如果某灰度级的概率分布大于平台阈值P,将其概率分布置为P;如果其概率分布小于平台阈值P,就保持不变。其中h(rk)为原始图像的直方图。

平台直方图均衡化的本质是利用平台值适度限制背景和噪声灰度的增强,为目标细节的提升留出灰度空间,其图像增强效果和平台值P的选取直接相关,如果平台值选择合适,平台直方图均衡能够起到较好的增强效果[9,10],但算法需要选择一个合适的平台值,这就限制了算法的应用。

3 自适应直方图均衡

3.1 算法原理

对比度低的红外图像,其直方图分布集中,直方图中主峰所对应的灰度级往往是图像中的背景,当红外图像中的目标较小时,图像直方图的这种分布特点更加明显。基于上述事实,本文算法的基本思想是,先对图像的直方图进行加权处理,加权的结果使得原始图像的直方图主峰被平滑掉了,这样便为目标的增强留下灰度空间,然后根据加权后的直方图对图像进行直方图均衡化(HE)处理。

算法原理如下,设h(rk)为原始图像的直方图分布,w(x,T)为加权函数,其中T为一个参数集。首先,按式(2)统计原始图像的直方图得到h(rk),其中nk为灰度级为rk的像素总数。

根据h(rk)的性质,计算出加权函数w(x,T)的参数集T0,从而确定加权函数w(x,T0);然后用该函数对原始红外图像的直方图分布h(rk)进行式(3)所示的加权处理。

用加权后的直方图pr(rk),按式(4)求出每一灰度级的累计概率分布作为灰度变换系数(算法中取L=256)。

最后,根据灰度变换系数,按式(5)求出各像素点图像增强后的灰度值([]表示取整)。

3.2 加权函数

实验表明,红外图像的直方图分布主峰呈现指数型的形式,因此算法中所用的加权函数为指数型加权函数。加权函数的表达式为

加权函数中,a,b,c为三个可调参数。参数a决定函数“阻带”(即函数开口)的大小,参数b决定“阻带”的“位置”,随着b值的不同,加权函数的“阻带”可左右移动。参数c决定阻带的“深度”。当c取0时,算法退化为直方图均衡(HE),c越大时,对直方图的主峰削弱程度越大,c达到1时,可将整个主峰削掉。

加权函数的“阻带”宽度∆x与a的关系为

其中“阻带”宽度定义为函数exp(-x2/a)的幅值下降到峰值的处的宽度。

加权函数的作用如图1所示,由图中可见经过加权后,原始直方图中的主峰被“平滑”掉了,而直方图的其余部分基本未变。

3.3 加权函数参数的确定

加权函数的形状和位置由参数a、b、c决定,本算法中,通过对原始图像直方图分布的分析,来确定这三个参数。因此,加权函数的“阻带”位置、大小和深度会随着图像的直方图分布自适应地变化。最后加权的结果使得原始图的主峰被平滑掉。

参数的确定流程如下。首先搜索原始红外图像的直方图,得到其主峰的“位置”r0和“高度”h(r0)即式(8)所示。

根据h(r0),搜索直方图得到主峰的带宽∆r。(带宽定义为其幅值下降到峰值的处)。

然后,将加权函数的“阻带”位置、宽度与直方图的主峰“带宽”的位置、宽度相一致。即令:

可确定到a与b

加权函数阻带的“深度”,取决于原始图像直方图峰值的高度。显然,当图像直方图峰值较大时,加权函数的作用应增大;当直方图峰值较小时,加权函数的作用应减少,特别当直方图分布较均匀时,算法应退化为直方图均衡(HE)。基于上述思想,c的表达式为

其中h(r0)/∑rh(kr)是直方图峰值处的概率。经过实验,发现系数20有较好的增强效果。

4 实验结果及讨论

根据上述算法,对若干幅不同场景下的红外图像进行了增强实验。其中两幅图像的实验结果如图2所示。第一组图像是室内的人像,其直方图分布非常集中。分别对它用直方图均衡(HE)、平台直方图均衡(PE)(取平台值为120)和本文的算法进行处理。从图中可以看到,采用直方图均衡(HE),图像背景的噪声被放大了,增强的效果很不理想。采用平台直方图均衡(PE)算法,图像增强的效果要明显要好于直方图均衡(HE)。采用本文的算法增强,图像的背景被很好地抑制,细节增强效果(如衣服的邹折)优于平台直方图均衡(PE)。第二组图像是一座发电厂的远景图,相对第一组图,其直方图分布相对均匀一些,直方图中的主峰高度“较低”。从处理效果来看,直方图均衡(HE)使图像偏亮。本文的算法与平台直方图均衡(PE)(取平台值为100)相差不大。

总的来看,当图像的直方图分布非常集中时(直方图中有较高的主峰),本文算法的增强较果要优于选定阈值的平台直方图均衡。当图像直方图中主峰较低时,本文算法的增强较果与选定阈值的平台直方图均衡相差不大。特别的,当图像的直方图分布均匀时,本文的算法会退化为直方图均衡(HE),图像增强的效果与直方图均衡(HE)几乎一样。

结束语

实验结果表明,本文提出的自适应直方图均衡算法,克服了一般直方图均衡算法的缺点,能够自适应地对原始图像进行直方图均衡。从实验效果来看,整个算法对红外图像具有较好的增强效果,可较好地抑制图像的背景,突出目标。将此算法硬件化将是进一步的研究内容。

参考文献

[1]刘志才,李志广.红外热像仪图像处理技术综述[J].红外技术,2000,2(6):27-32.LIU Zhi-cai,LI Zhi-guang.A Review on Image Process Technique of Thermal Imager[J].Infrared Technology,2000,2(6):27-32.

[2]赵耀宏,向伟,罗海波,等.SOPC技术在实时红外图像处理中的应用[J].红外与激光工程,2005,34(6):745-751.ZHAO Yao-hong,XIANG Wei,LUO Hai-bo,et al.The application of SOPC technology in real-time infrared image processing[J].Infrared and laser Engineering,2005,34(6):745-751.

[3]Rafael C Gonzalez,Richard E Woods.Digital Image Processing(second edition)[M].Beijing:Publishing House of Electronics Industry,2002:88-94.

[4]Stark J Alex.Adaptive image contrast enhancement using generalizations of histogram equalization[J].IEEE Trans.Image Process,2000,9(5):889-896.

[5]Lau S S Y.Global image enhancement using local information[J].Electron.Lett,1994,30(2):122-123.

[6]Vicker V E.Plateau equalization algorithm for real time display of high quality infrared imagery[J].Opt.Eng,1996,35(7):1921-1926.

[7]Silverman J,Mooney J M,Vickers V E.Display of wide dynamic range infrared images from PtSi Schottky barrier cameras[J].Optical Engineering,1990,29(2):97-104.

[8]WANG Bing-jian,LIU Shang-qian,LI Qing,et al.A real-time contrast enhancement algorithm for infrared images based on plateau histogram[J].Infrared Physics&Technology,2006(48):77-82.

[9]陈洪,常青,郭天天,等.一种易于硬件实现的红外图像实时增强算法[J].红外与激光工程,2004,33(3):282-287.CHEN Hong,CHANG Qing,GUO Tian-tian,et al.Real-time infrared image enhancing algorithm easy to implement[J].Infrared and Laser Engineering,2004,33(3):282-287.

基于直方图统计特征的虹膜粗分类 篇5

由于虹膜具有唯一性好、稳定性强、非侵犯性等优点,目前基于虹膜的身份识别技术已成为身份识别领域的研究热点之一。自上世纪90年代以来,国内外学者发表了大量的研究成果。Daugman[1]提出了一种基于二维Gabor滤波器分析虹膜纹理相位的识别算法。Wildes[2]提出了一种基于Laplacian金字塔分析的识别算法。Ma[3]提出了一种基于多通道纹理分析的识别算法。Ma[4]提出了一种基于虹膜纹理变化关键点的识别算法。Feng[5]、Dey[6]等也对虹膜识别进行了研究。

现有的虹膜匹配算法是在待识别虹膜样本与虹膜图像库中所有样本逐一匹配的基础上得到识别结果的。因此,当虹膜图像库规模较大时,匹配的过程会非常耗时,影响了算法的性能。虹膜粗分类(根据虹膜纹理结构将虹膜图像划分为若干类型)可以解决这一问题,具体思路是:虹膜识别时,首先利用粗分类算法将未知样本划分为某一类型,然后在该类型对应的虹膜样本中进行虹膜匹配。本文提出了一种基于直方图统计特征的虹膜粗分类算法:利用直方图比率算法提取不同虹膜纹理类型的直方图统计特征,并通过比较相似度对虹膜图像进行粗分类。

1 虹膜纹理的类型

与指纹识别、掌纹识别不同,虹膜纹理类型的识别还处于起步阶段。根据现有文献,虹膜纹理类型的划分主要有以下两种方法:第一,利用虹膜纹理的直观特点进行分类。Yu[7]根据虹膜纹理的分布形态和位置将虹膜模式划分为四类,以分形维数作为虹膜类型的特征,采用双阈值法识别未知虹膜的类别。第二,利用虹膜纹理的统计特性进行分类。Qiu[8]以虹膜纹元(texton)的灰度直方图为特征,通过机器学习将虹膜图像划分为五类。相对而言,第一种方法所划分的虹膜纹理类型更为直观,有利于寻找具有较强区分度的特征向量。因此,本文也采用虹膜纹理的直观特点来划分虹膜纹理的类型。

参考Yu[9]关于虹膜纹理类型的划分标准,本文根据虹膜纹理的灰度分布特点以及纹理结构特点,将虹膜纹理划分为五种类型,每类的具体形态如图1所示,具体特征描述如下:

第一类,辐射状结构(Stellate)。这种结构富含纹理纤维,绝大部分纹理贯穿整个虹膜区域且呈辐射状分布,纹理纤维之间的间隙较小,具体形态如图1(a)所示。

第二类,丝织状结构(Silk)。这种结构所含的虹膜纹理非常少,虹膜纹理表面平滑、单一,灰度变化不明显,与丝织品比较类似,具体形态如图1(b)所示。

第三类,麻布状结构(Linen)。该结构下虹膜纹理被虹膜卷缩轮近似分为两半:上半部纹理较多且呈网格状或辐射状分布,而下半部纹理相对较少且表面平滑,具体形态如图1(c)所示。

第四类,网格状结构(Grid)。这种结构的虹膜纹理中分布有大量的斑块,纹理纤维之间的间隙较大,虹膜纹理整体形态类似网格,具体形态如图1(d)所示。

第五类,随机状结构(Random)。该结构下虹膜纹理没有固定的结构,虹膜纹理中往往出现零星的斑块,而且位置比较随机,具体形态如图1(e)所示。

由于上述五种类型的虹膜纹理具有不同的灰度分布和结构形态,所以可以利用直方图特征对其进行描述并提取相应的类别特征。根据这一思路,本文提出了基于直方图统计特征的虹膜粗分类算法。

2 直方图统计特征

本文通过直方图比率算法[10]来提取各类虹膜纹理的统计特征。设图像库包含有N类图像,灰度级为M级;每类图像有K个训练样本,样本的直方图由灰度级集合和对应灰度级的概率分布两个集合共同构成。则第i类图像所有样本直方图的交集为

式中:Bi为第i类图像训练样本共有的灰度等级集合;Ci为第i类图像训练样本共有的灰度等级下的概率分布集合;m为第i类图像训练样本共有的最大灰度等级;cij为灰度等级j时第i类图像中全部样本的概率分布组成的向量。则对Bi中的每对灰度值(bid,dil)(d

根据上述公式,利用各种虹膜纹理类型的训练样本可以得到一组统计特征,其形式为灰度等级下的概率分布。通过比较直方图统计特征,就可以实现对虹膜图像的粗分类。

3 虹膜粗分类算法

3.1 虹膜图像预处理

虹膜是人眼中位于瞳孔和巩膜之间的近似的圆环状区域。在提取虹膜纹理的直方图特征之前,首先需要利用定位、归一化以及对比度增强等算法对虹膜图像进行预处理。相关内容的详细讨论参见作者前期的工作[10,11]。另外,考虑到接近巩膜的虹膜区域包含的纹理信息较少,且容易受到眼睑、睫毛的干扰,所以将该区域定为非信息区,其他的虹膜区域定为信息区,虹膜纹理的类型特征主要在信息区内提取。

3.2 虹膜类型的特征提取

针对不同虹膜纹理类型的灰度分布特点,本文采用直方图统计特征来解决虹膜纹理类型特征的描述问题。在提取特征时,首先将预处理得到的虹膜纹理信息区划分为均匀大小的8个子块,如图2所示。然后,分别在8个子块中计算直方图比率并获得相应虹膜纹理区域的统计特征Rj。对于待识别样本,由于只需考虑单样本的情况,所以其特征提取公式如下所示

3.3 虹膜的粗分类

式中为子块j中灰度等级对的总数。本文采用阈值法识别未知样本的类型,所用的阈值是通过实验确定的,即利用算法对已知类别的样本进行分类,在尽可能避免错误分类的前提下,确定下限值作为最终的阈值。如果未知样本与第i类比较所得的全部子块的相似度均大于阈值T,则将该样本识别为第i类。当未知样本可被粗分类为多个类别时,取全部子块的平均相似度最高值所对应的类型为其所属类别。需要特别指出的是,由于随机状结构的虹膜纹理类型没有确定的类别特征,所以在实际判别中不属于前四类的未知样本将被识别为随机状结构。

4 仿真实验与分析

为了测试所提算法的有效性,本文设计了如下的一系列仿真实验。实验中的虹膜图像来源于中科院的CASIA数据库[12],图像为320像素×280像素,256色灰度。实验设备采用celeron2.6 GHz、128 M内存的计算机,仿真软件为Matlab7.0。

4.1 所提算法的识别性能

测试所用的样本库由500张挑选出的虹膜图像构成,各类型的虹膜纹理所占的具体数目为:第一类28张,第二类117张,第三类221张,第四类87张,其余的47张为第五类。针对测试样本库的分类结果如表1所示。

仿真实验表明所提算法的粗分类准确率可以达到98.2%。实验中有9个样本被错分(指将属于某类的样本划分为其他类别的情况),其中第二类占1例,第三类占3例,第四类占3例,第五类占2例。上述实验数据说明,本文采用的虹膜纹理类型特征可以有效的描述虹膜的纹理结构;所提算法能够对未知虹膜样本进行粗分类,并具有较好的识别精度。由于第一类和第二类的灰度特征比较明显,容易区分,所以粗分类的准确率较高;而第三类和第四类某些样本的虹膜纹理结构变异程度较大,有可能被错误识别为第五类。因此,继续深入研究虹膜纹理的结构,将第三类、第四类进行细分,可能会进一步提高虹膜粗分类的精度。

4.2 所提算法对虹膜匹配算法性能的改善

为了定量说明所提算法对现有虹膜匹配算法性能的改善,本文进行如下的对比实验:分别用所提算法结合Daugman虹膜匹配算法与原始的Daugman虹膜匹配算法在前文所提图像库中进行虹膜匹配,比较所用的匹配时间、达到的匹配精度等性能指标。其中,匹配时间指每个样本由匹配开始至得出匹配结果所需要的平均时间;匹配精度指错误接受率(FAR)、错误拒绝率(FRR)以及等错误率(ERR)等指标。为了尽可能避免粗分类错误对Daugman匹配算法精度的影响,实验中对所提算法进行如下修改:当某样本被粗分类为多个类别时,不再利用平均相似度做进一步判定,而是将其识别为多类别样本,则Daugman算法在相应的多个类别所包括的全部样本集合内进行匹配。具体的实验数据如表2所示。由表2的数据可知,与原始的Daugman匹配算法相比,利用所提算法粗分类后再使用Daugman算法进行匹配不仅使虹膜匹配时的等错误率提高了0.03%,而且使得匹配时间下降了29.4%。这表明所提粗分类算法能够改善虹膜匹配的性能,对于大规模虹膜数据库环境下匹配性能的提高具有实际意义。

5 结论

本文提出了一种基于直方图统计特征的虹膜粗分类算法。该算法通过直方图比率算法提取虹膜纹理的统计特征,有效的描述了不同虹膜纹理类型的灰度分布和结构特征,实现了对虹膜的粗分类。仿真实验表明,所提算法对虹膜粗分类的准确率可以达到98.2%。另外,利用所提的虹膜粗分类算法,可以提升Daugman虹膜匹配算法的精度,缩短匹配过程的耗时。因此,对于大规模虹膜数据库环境下匹配性能的提高,所提算法具有一定的实际意义。

摘要:为改善大规模虹膜数据库中虹膜匹配算法的性能,本文提出了一种基于灰度统计特征的虹膜类型识别算法。该算法首先将虹膜纹理区域划分为8个子块,然后利用直方图比率提取虹膜类型的直方图统计特征。最后,根据对应子块特征的相似度将虹膜图像识别为五种类型。所提算法在CASIA虹膜库中挑选的500幅虹膜图像样本上进行了测试。仿真实验结果表明,所提算法对虹膜粗分类的准确率达到了98.2%。相对原有的Daugman虹膜匹配策略而言,所提算法结合Daugman算法的虹膜匹配策略不仅可以降低虹膜匹配的等错误率,而且使得匹配所用的时间下降了29.4%。

关键词:统计特征,虹膜匹配,虹膜粗分类

参考文献

[1]Daugman J G.Probing the uniqueness and randomness of iris codes:results from200billion iris pair comparisons[J].ProcIEEE(S0018-9219),2006,94(11):1927-1935.

[2]Wildes R P.Iris recognition:an emerging biometric technology[J].Proc.IEEE(S0018-9219),1997,85(9):1348-1363.

[3]MA L,TAN T N,WANG Y H.Personal identification based on iris texture analysis[J].IEEE Trans Pattern Anal Mach Intell(S0162-8828),2003,25(12):1519-1533.

[4]MA L,TAN T N,WANG Y H,et al.Efficient iris recognition by characterizing key local variations[J].IEEE Trans.on Image Processing(S1057-7149),2004,13(6):739-750.

[5]FENG G,WU Y Q.An iris recognition algorithm based on DCT and GLCM[J].Proceedings of the SPIE(S0277-786X),2008,7000:1-8.

[6]Dey S,Samanta D.An efficient approach to iris detection for iris biometric processing[J].International Journal of Computer Applications in Technology(S0952-8091),2009,35(1):2-9.

[7]YU L,ZHANG D,WANG K,et al.Coarse iris classification using box-counting to estimate fractal dimensions[J].Pattern Recognition(S0031-3203),2005,38:1791-1798.

[8]QIU X C,SUN Z N,TAN T N.Coarse iris classification by learned visual dictionary[J].Lecture Notes in Computer Sciences(S0302-9743),2007,4642:770-779.

[9]Paschos G,Petrou M.Histogram Ratio Features for Color Texture Classification[J].Pattern Recognition Letters(S0167-8655),2003,24(13):309-314.

[10]TANG R N,HAN J Q,ZHANG X M.An effective iris location method with high robustness[J].Optica Applicata(S0078-5466),2007,37(3):295-303.

[11]唐荣年,韩九强,张新曼.一种Log-Gabor滤波器结合多分辨率分析的虹膜识别方法[J].西安交通大学学报,2009,43(4):30-33,61.TANG Rong-nian,HAN Jiu-qiang,ZHANG Xin-man.Iris recognition method using Log-Gabor filter and multi-resolution analysis[J].Journal of Xi’an Jiaotong University,2009,43(4):30-33,61.

直方图法 篇6

随着多媒体技术和网络环境的发展, 以各种方式获取的图像数据增长迅猛, 图像检索日渐成为引人关注的课题之一。传统基于文本检索方案的检索, 由于文字很难完全表达图像的丰富内容, 同时人工标注工作量大且具有主观性。因此, 对图像的检索更多地希望在内容基础上进行。图像的物理特征为基于内容的图像检索提供了很好的基础[1]。

根据使用的图像特征不同, 图像检索可以分为色彩方法、纹理方法和形状方法。计算图像的色彩特征更方便、快速, 因此色彩方法是图像检索中常用的方法。图像的颜色直方图是图像中各种色彩出现的频率, 它反映图像的颜色特征, 而且不因图像的几何变换而改变, 是检索中经常使用的特征[2]。颜色索引技术 (color indexing) 作为一种图像相似检索方法最早在文献[3]中提出, 它的核心思想是计算图像的颜色分布, 即颜色直方图 (color histogram) , 并利用直方图相交算子 (histogram intersection) 计算图像之间的相似度。然而, 如文献[4]中所分析的那样, 直方图方法存在诸多缺陷, 例如可能会有两幅完全不一样的图像却具有完全相同的颜色直方图, 即颜色直方图没有考虑图像的颜色空间分布信息。为了克服直方图方法中出现的这种问题, 本文提出对检索图像和数据库图像先用直方图进行检索, 然后再根据直方图检索没有考虑颜色的空间分布信息这一局限性, 引入了一个描述颜色空间关系的一维矢量, 提高了彩色图像检索的性能。

1直方图检索算法

对于选择的数据库图像和查询图像, 分别提取R、G、B三个颜色分量的统计直方图, 即:

H (k) =nk/n, k=0, 1, …, L-1 (1)

其中k代表图像的特征取值, L代表特征可取值的个数, nk是图像中具有特征值为k的像素个数, n是图像像素的总数。

采用直方图相交算法作为距离度量 (D代表数据库图像, Q代表查询图像) :

undefined (2)

用公式 (2) 分别计算查询图像各颜色分量与数据库图像各颜色分量的统计直方图相交距离, 用Pr、Pg、Pb分别表示查询图像与数据库图像之间的红色、绿色、蓝色分量的距离 (可以是直方图相交距离或其它方法计算出来的距离) 。依据所选择的示例图像和数据库图像在颜色分配上的不同情况给Pr、Pg、Pb分别选定不同的权重作为最后的相交距离, 即:

P (Q, D) =WrPr+WgPg+WbPb (3)

其中Wr、Wg、Wb分别表示红色、绿色和蓝色分量的权重 (加权系数) , 且有Wr+Wg+Wb=1。

这里我们选取由红色小汽车所组成的图像库, 在检索时, 将Wr、Wg、Wb分别取不同的值, 得到的检索结果如下 (Wg、Wb取值相同) :

针对Wr的不同取值, 在同一个坐标系里画出其PVR曲线, 如图4所示:

从图4中我们可以看到:Wr取值越大, 检索性能相对越好。其原因是所选取的图像库是红色为主的。对于不同的图像库, 要针对实际情况给予不同的选取。

2方法的改进

众所周知, 直方图检索虽然不受旋转和平移变化的影响, 但没有表达出颜色的空间分布信息。因此, 如果在一般颜色直方图的基础上加入对像素空间分布的统计[5], 即可将空间和颜色特征相结合。

对于一幅彩色图像, 这里引入了一个一维特征矢量C (k) , 它表示所有具有颜色k的像素的数目。设两个像素pi和pj之间的距离为d (pi, pj) , 这里的距离定义为欧氏距离:

undefined (4)

其中 (xi, yi) , (xj, yj) 分别表示像素pi和pj的坐标。

从具有颜色k的像素到所有具有颜色k的像素的平均距离定义为:

undefined (5)

这个平均距离可以看作像素pi的一个特征, 表达了像素pi与其它具有颜色k的像素的远近程度。

对于真彩图像, 其每一种颜色分量都是256级的, 即每一种颜色分量的像素值都在0到255之间变化。因此, 对于所选取的查询图像和数据库图像的每一种颜色分量, 在用公式 (5) 计算像素间的平均距离之后, 得到的是256个平均距离。将这组平均距离表示成一维向量的形式:

V= (m0, m1, m2, …, mk, …, m255) (6)

其中mk表示所有具有颜色k的像素值的平均距离。

在引入了一维的空间关系特征矢量之后, 对所选取的查询图像和数据库图像进行相似匹配时, 采用欧式距离为相似度量的标准:

其中mQi、mDi分别代表查询图像和数据库图像的颜色值为i的像素的平均距离。

3结合颜色空间的直方图检索算法

引入了表达颜色空间分布关系的一维矢量之后, 对于彩色图像的检索过程可以描述为:

(1) 对于一幅真彩的RGB查询图像, 分别提取其三个颜色分量R、G、B的统计直方图。

(2) 对于每一个颜色分量的一个具有特定的颜色k的像素, 统计所有具有颜色k的像素的数目, 再根据公式 (4) 、 (5) 分别计算该分量中所有具有颜色k的像素与其的平均距离, 并将此平均距离按照公式 (6) 排列成一维向量的形式。

(3) 对数据库图像也与查询图像一样做同样的处理。

(4) 用公式 (7) 分别计算查询图像和数据库图像的各颜色分量所引入的一维空间关系矢量的相似距离。

(5) 将查询图像和每一幅数据库图像各颜色分量统计直方图用直方图相交算法 (2) 计算它们之间的相交距离。

(6) 这里选取由红色小汽车构成的图像库, 红色分量的权重应该增大。因此, 在确定最后的相交距离时, 规定颜色特征和空间关系特征所占据的位置相同, 即各占50%, 而且对于颜色特征和空间关系中的红色分量的权重占各自特征的90%, 而绿色和蓝色分量的权重相同, 即用公式 (3) 分别计算直方图相交距离和空间关系距离, 再将这两个距离取加权平均得到最后的距离。

(7) 将用Wr=0.9, Wg=Wb=0.05的直方图方法检索出来的结果和引入空间关系之后的检索结果按相似性排列如图5和图6所示 (相似性从左到右、从上到下降序排列) :

4检索结果的比较

为了测试在加入颜色的空间分布信息时, 检索性能的优越, 在同一坐标系里分别作出了它们的PVR曲线如图7所示。

由图7可知, 加入了颜色的空间分布特征后的检索, 查全率和查准率都有了一定程度的提高。但是, 在检索过程中可以发现, 由于加入了对图像的各颜色分量的像素的统计和平均距离的计算, 增加了检索时间。因此, 对于图像检索系统来说, 如果要求检索精度高而对检索时间的要求不高时, 本文提出的方法是很有效的。

参考文献

[1]王海霞, 覃团发.综合MPEG-7中颜色特征的图像检索方法[J].计算机应用研究, 2005, 3:164-168.

[2]王宇生, 陈纯.一种新的基于色彩的图像检索方法[J].计算机研究与发展, 2002, 39 (1) :105-109.

[3]Swain M J, Ballard D H.Color indexing[J].Internation-al Journal of Computer Vision, 1991, 7 (1) :11-32.

[4]Androutsos D, Plataniotis K N, Venetsanopoulos A N.ANovel Vector-Based Approach to Color Image RetrievalUsing a Vector Angular-Based Distance Measure[J].Computer Vision and Image nderstanding, 1999, 75 (1/2) :46-58.

直方图法 篇7

1 基于交叉分块直方图的图像检索方法

1.1 RGB颜色空间

颜色空间能够将抽象的颜色特征表示为数学形式, 便于计算机处理与分析。颜色空间一般通过三维坐标系统来描述颜色特征, 将每一种颜色映射为坐标系统中的一个点。目前, 常见的颜色空间有RGB、HSI、CMY、CMYK等[8], 其中, RGB颜色空间实现简单, 是许多图像处理软件及设备的默认颜色空间。RGB颜色空间如图1所示, 空间中的每一点代表一种颜色, 每一种颜色用红 (red) 、绿 (green) 、蓝 (blue) 三个分量表示。

1.2 颜色特征提取

1.2.1 颜色直方图

颜色直方图是对图像颜色种类及分布规律的统计, 能够反应具有某种颜色值的像素占一幅图像总像素的比例。如图2所示, 图2 (b) 为左侧原始图像的颜色直方图, 其横坐标表示图像的灰度等级 (0~255) , 纵坐标表示具有某一灰度等级的总像素数。

令C={c1, c2, …, cm}表示图像f (x) 中所有颜色值组成的集合, 其中m为颜色种类, 则图像f (x) 中颜色值为cr (1≤r≤k) 的总像素数的计算公式见式 (1) 。

式 (1) 中, m×n为图像f (x) 的大小, fij为图像f (x) 在坐标 (i, j) 处的幅值。

则图像f (x) 的颜色直方图可表示为

1.2.2 分块直方图

提取分块直方图是在将图像划分为若干子图像的基础上进行的, 分块直方图是一幅图像的若干子图像颜色直方图的集合。如图3所示, 首先将图像进行4×4均匀分块, 得到16个子图像;然后根据式 (1) 和式 (2) 分别计算16个子图像的颜色直方图;最后, 16个子图像的颜色直方图组成的集合就构成了整幅图像的分块直方图特征。分块直方图属于局部颜色特征, 与全局颜色特征相比, 它包含了图像的位置信息, 因此, 以分块直方图为特征进行图像检索通常能够取得更好的检索效果。

1.2.3 交叉分块直方图

分块直方图强调图像的位置信息, 但容易将图像目标划分在不同的子图像中, 破坏图像目标的完整性。同时, 分块直方图检索方法在计算相似度时赋予各子图像颜色直方图相等的权重, 不能突出图像目标, 也无法限制图像背景。

因此, 提出了一种基于交叉分块直方图的图像检索方法。该方法采用交叉的方式对图像进行分块, 得到相互交叠的若干子图像, 并且交叠次数最多的区域为图像的中心区域。基于交叉分块直方图的图像检索方法以各子图像的颜色直方图组成的集合为颜色特征向量, 对于交叠的区域, 其颜色直方图信息也会被重复统计, 因此, 颜色直方图特征被重复计算次数最多的区域为图像的中心区域。图像目标一般处于中心区域, 所以基于交叉分块直方图的图像检索方法能够依据子图像间的交叠自动赋予图像中心区域最高的权重, 突出了图像目标;同时, 各子图像均包含大量的目标信息, 保持了图像目标的完整性。

基于交叉分块直方图的图像检索方法流程如图4所示, 首先对图像进行交叉分块得到若干子图像, 并提取各子图像的颜色直方图获得交叉分块直方图特征;然后利用空间距离算法度量不同图像间交叉分块直方图特征的相似性;最后根据相似性度量结果确定检索输出图像。

1.2.3. 1 交叉分块

如图5 (a) 所示, 交叉分块方法将图像分为红框、黄框、紫框和蓝框4个子图像, 每个子图像的长和宽分别为原图像的3/4, 即大小为原图像的9/16, 图5 (b) ~图5 (e) 分别为交叉分块得到的4个子图像。可以看出, 4个子图像均包含丰富的目标信息, 能够较好地保持图像目标的完整性;同时, 4个子图像相互重叠, 中心区域9重叠四次, 四角区域1、2、3、4无重叠, 其余区域5、6、7、8各重叠两次。

1.2.3. 2 提取交叉分块直方图

图像的交叉分块直方图是由4个子图像的颜色直方图组成的集合, 对交叉分块得到的4个子图像, 分别根据公式 (1) 和公式 (2) 计算其颜色直方图, 得到图像的交叉分块直方图特征。

由于交叉分块得到的子图像间相互交叠, 在统计图像颜色直方图信息时, 中心区域的颜色信息被重复计算, 如图5所示, 1、2、3、4四个子区域的颜色信息仅被统计1次, 5、6、7、8四个子区域的颜色信息均被重复统计2次, 而中心子区域9的颜色信息则被重复统计了4次。因此, 在一幅图像的交叉分块直方图特征中, 中心区域的颜色信息占有最大的比例, 四角区域则占有最小的比例, 从而突出了图像目标, 限制了图像背景。

1.2.3. 3 相似性度量

在基于内容的图像检索中, 相似性用于衡量两幅图像间的视觉差异程度, 常采用空间距离算法定量计算, 如绝对值距离、欧式距离、二次距离、直方图相交距离、马氏距离等[9,10]。欧式距离表示空间中两点之间的实际距离, 因此能够表征两种颜色之间的实际距离, 从而度量图像间颜色特征的相似性。本文选择欧式距离算法进行图像间的相似性度量, 其计算公式如下,

式 (3) 中, A={a1, a2, …, ai, …, an}, 为输入图像的颜色特征向量;B={b1, b2, …, bi, …, bn}, 为图像库图像的颜色特征构成的颜色特征数据库。

2 仿真实验与结果分析

基于交叉分块直方图的图像检索方法以MAT-LAB软件为平台进行了仿真实验。从Corel标准图像库中选择1 000幅图像作为仿真实验的基础图像库, 包括马、花、大象、恐龙、海边风景、人物、汽车、建筑物、食物和雪山10种类型图像, 每种类型100幅。为了验证本文所提方法的有效性, 利用基础图像库分别进行了基于均匀分块直方图的图像检索方法和基于交叉分块直方图的检索方法的仿真实验, 图6为利用上述两种检索方法得到的输出结果示例, 其中, (a) 为输入图像, (b) 为利用均匀分块直方图检索方法得到的输出图像 (前20幅) , (c) 为利用交叉分块直方图检索方法得到的输出图像 (前20幅) 。

基于内容的图像检索系统的性能通常用查全率和查准率两个指标来衡量[11]。查全率是指在图像库所有与输入图像相关的图像中, 检索输出的与输入图像实际相关的图像所占的比例;查准率是指在检索输出的所有图像中, 与输入图像实际相关的图像所占的比例。

在仿真实验中, 选择相似度最大的前40幅图像作为检索输出结果。令检索输出图像中与输入图像实际相关的图像数为n, 根据查全率和查准率的定义可知, n/100和n/40分别为实验中的查全率值和查准率值。由于二者成正比, 现选择两个指标中的查准率作为衡量检索性能的指标。同时为了降低实验误差, 针对图像库中每一种类型的图像, 计算20幅不同输入图像所对应的查准率值的平均值作为该类型图像的最终查准率结果。

根据仿真实验的结果, 基于均匀分块直方图和基于交叉分块直方图的图像检索方法在检索10种类型图像时得到的查准率的数据见表1, 折线图如图6所示。

观察表1和图7可以发现, 除检索马类图像时交叉分块直方图检索方法的查准率与均匀分块直方图检索方法相等外, 对其他9种类型的图像, 均是采用交叉分块直方图检索方法得到的查准率较高, 说明基于交叉分块直方图的检索方法要优于基于均匀分块直方图的检索方法。交叉分块直方图检索方法采用的交叉分块方法不仅包含了图像的空间信息, 而且克服了均匀分块直方图检索方法破坏图像目标内容完整性的缺点, 同时根据子图像间的交叠自动为不同区域的颜色特征赋予不同的权重, 突出了图像的目标内容, 因此能够取得更好的检索性能, 适用于对多种类型图像的检索。

3 结论

基于内容的图像检索方法通过比较不同图像间固有特征的相似性来检索图像, 提高了基于文字的图像检索技术的准确率, 具有较好的发展前景。由于颜色能够直观表达图像的主要内容, 所以基于颜色的图像检索是一种有效实用的检索技术。本文提出了一种基于交叉分块直方图的图像检索方法, 该方法能够有效保持图像目标的完整性, 突出目标区域对检索结果的影响。为了验证所提方法的有效性, 从Corel图像库中选择10种类型的共1000幅图像组成基础图像库, 分别进行了基于均匀分块直方图和基于交叉分块直方图的图像检索方法的仿真实验, 并以查准率为指标定量测试了两种检索方法的性能。仿真实验结果表明, 基于交叉分块直方图的图像检索方法的查准率高于基于均匀分块直方图的图像检索方法, 即验证了本文所提方法的有效性。随着视频图像的广泛应用, 综合颜色、纹理、形状、语义等多种图像特征的检索技术将得到更广泛的应用。

摘要:在基于内容的图像检索技术中, 颜色是常用的图像特征。提出了一种基于交叉分块直方图的图像检索方法。首先, 对图像进行交叉分块得到若干子图像;然后提取子图像的颜色直方图特征, 构造特征向量;最后根据空间距离度量图像间的相似程度, 确定检索输出结果。用交叉方式分块得到的子图像间相互交叉重叠, 能够在获取图像颜色特征空间分布信息的同时保持图像目标的完整性, 并有效抑制图像背景区域对检索结果的干扰。仿真实验结果表明, 基于交叉分块直方图的图像检索方法具有优于基于均匀分块直方图的图像检索方法的性能, 适用于对多种类型图像的检索。

关键词:图像检索,颜色直方图,交叉分块,相似性度量

参考文献

[1] Swain M J, Ballard D H.Color indexing International Journal of Computer Vision, 1991;7 (1) :11—32

[2] Dimai A.Spatial encoding using differences of global features.SPIE, 1997;3022:352—360

[3] Malki J, Boujemaa N, Nastar C, et al.Region queries without segmentation for image retrieval by content.Proceedings of the Third International Conference on Visual Information and Information Systems.London, UK:Springer-Verlag, 1999;1614:115—122

[4] Rao A, Srihari R, Zhang Z.Spatial color histogram for content-based retrieval.In:11th IEEE International Conference on Tools with AI, 1999:183—186

[5] 陶志勇, 张新君, 马振和.一种基于颜色直方图的图像检索方法.科学技术与工程, 2007;7 (24) :6450—6482Tao Zhiyong, Zhang Xinjun, Ma Zhenhe.An image retrival method based on color histogram.Science Technology and Engineering, 2007;7 (24) :6450—6482

[6] 安志勇, 杜志强, 赵珊, 等.基于颜色和空间特征的图像检索.红外技术, 2007;29 (6) :361—364An Zhiyong, Du Zhiqiang, Zhao Shan, et al.A new approach for image retrieval based on color and spatial features.Infrared Technology, 2007;29 (6) :361—364

[7] 刘芳, 王涛, 周登文.基于颜色—空间二维直方图的图象检索.计算机工程与应用, 2002;38 (12) :85—88Liu Fang, Wang Tao, Zhou Dengwen.Image retrieval based on colorspace 2D histogram.Computer Engineering and Applications, 2002;38(12) :85—88

[8] Gonzalez R C, Woods R E.数字图像处理 (第二版) .阮秋琦, 阮宇智, 等译.北京:电子工业出版社, 2007:228—239Gonzalez R C, Woods R E.Digital image processing, Second Edition.Yuan Qiuqi, Yuan Yuzhieds.Beijing:Publishing House of Electronics Industry, 2007:228—239

[9] 何亚犇.基于颜色特征的图像检索算法研究.太原:太原理工大学, 2012He Yaben.The Research of Color-Based Image Retrieval.Shanxi:Academic Degree Thesis of Major of Communication and Information, Taiyuan University of Technology, 2012

[10] 刘敬.基于内容的图像检索技术研究.武汉:武汉理工大学, 2011Liu Jing.The Research of Content-Based Image Retrieval Techniques.Wuhan:Wuhan University of Technology, 2011

【直方图法】推荐阅读:

直方图均衡07-22

直方图增强08-28

直方图算法08-28

梯度方向直方图特征论文06-28

上一篇:双腔T管下一篇:小组学习

本站热搜

    相关推荐