直方图算法

2024-08-28

直方图算法（通用10篇）

直方图算法篇1

1 引言

图像分割(Image Segmentation)是把图像分成各具特性的区域并提取出感兴趣目标的技术和过程,是图像处理的一个重要领域,被广泛应用于计算机视觉领域。从上个世纪七十年代起图像分割问题就一直受到人们的高度重视,并已经进行了广泛而深入的研究,特别是根据阈值的灰度图像分割,随着神经网络、遗传算法、蚁群算法、模式识别、模糊逻辑等理论的不断发展,这些理论也逐渐被引入到图像分割领域,产生了许多新的图像分割方法。阈值法是一种最简单最基本的图像分割方法。阈值法可与其他分割方法结合使用,以得到更好的分割结果。确定最佳阈值是阈值分割法的关键,利用遗传算法的特点来快速准确地确定灰度图像直方图熵的最佳分割阈值,实现图像分割。

2 图像分割算法

图像分割中如何求解最佳的阈值,寻找出最优分割参量,以保证有效的分割效果是研究的目标。为了使设计出的算法更有效地搜索到全局最优解,寻找出最佳阈值,利用遗传算法的特点来快速准确地确定灰度图像直方图熵的最佳分割阈值,实现图像分割。

基于遗传算法的直方图熵的图像分割算法的具体的实现步骤:

第一步:利用直方图熵方法处理图像。最大熵方法处理图像本质上就是将图像的各像素均匀地分布在各个灰度级上,使对比度差的原始图像得到改善。选取的灰度图利用直方图熵方法进行处理,得到一维数组,a[i],i=0,1,2,……,元素个数为256。

第二步:染色体编码。由于图像灰度值在0~255,正好对应一个8位二进制即一个字节,因此本算法也采用二进制编码方案,将各个染色体编码为8位二进制。每个染色体代表了一个分割阈值。并将它们按二进制形式进行编码,初始群体的每个个体都是随机产生的,其相应的适应度值也有高有低。

第三步:利用适应度函数。通过测量图像灰直方图的熵,找出最佳阈值。

图像总熵H(t)为目标熵H0(t)和背景熵HB(t)之和:

可见,当H(t)最大时将达到最好的分类效果。于是最佳阈值为:

上式中Argmax是求使函数H(t)最大的那个值t,即所求得的最佳分割阈值。因此采用公式(1)作为适度函数,满足最大熵即最高适应度值的个体为所求的最佳阈值。利用公式(1)计算初始群体中每个个体的适应度。

第四步:依据遗传策略,选用遗传算子,产生下一代群体。

第五步:直到找到最大值,否则继续执行第三步。

第六步:用找到的最佳阈值分割图像。

3 仿真实验

在Matlab 6.5操作平台,选取源图米粒图片(图1)进行仿真实验,分别用算法和传统的Otsu算法对源图进行分割,实验结果如表1以及图2和图3所示。对比两幅图像的分割结果可以看出,图2较图3轮廓清晰,分割效果相当好。

4 结语

结合遗传算法和灰度图像直方图熵法的特点,通过直方图最大熵法提高灰度图像质量,结合遗传算法的优化特性,提出一种新的寻找最佳阈值分割图像的方法。与传统分割算法相比分割时间短,分割效果明显。

摘要：图像分割是图像处理的一个重要领域。阈值法是一种最简单、最基本的图像分割方法。确定最佳阈值是阈值分割法的关键,利用遗传算法的特点来快速准确地确定灰度图像直方图熵的最佳分割阈值,实现图像分割。通过仿真试验验证,分割效果明显,该算法具有很好的应用前景。

关键词：遗传算法,直方图熵,图像分割

参考文献

[1]江兴方,陶纯堪,是度芳.用最大熵法改善图像质量[J].江苏工业学院学报,2005.

[2]孙艳歌,邵罕.基于改进遗传算法的最优阈值图像分割算法[J].信息系统工程,2010.

[3]龚声蓉,刘纯平,王强.数字图像处理与分析[M].北京:清华出版社,2006.

[4]冈萨雷斯.数字图像处理(MATLAB版)[M].北京:电子工业出版社,2007.

[5]王爱玲,叶明生,邓秋香.MATLAB R2007图像处理技术与应用[M].北京:电子工业出版社,2008.

“直方图”检测题篇2

1. 在对25个数据进行整理的频数分布表中，各组的频数之和等于.

2. 在一次抽样调查中收集了50个数据，其中32～36这一组的频数是6，则这组数据的个数占全部数据的百分比为.

3. 已知数据25，21，23，27，29，24，22，26，27，26，25，25，26，28，30，28，29，26，24，25，如果取组距为2，那么应分成组.

4. 某校七年级共有500名学生，为了调查这些学生的视力情况，随机抽查了30名学生.数据在0.95～1.15这一组的学生有9名，则可估计该校七年级学生中视力在0.95～1.15之间的有名.

5. 在某样本的频数分布直方图中有11个小长方形，若样本数据为160个，正中间的小长方形的面积等于另外10个小长方形面积之和的25%，则正中间这一组的频数为.

二、选择题

6. 考察50名学生的年龄，列频数分布表时，这些学生的年龄分别落在5个小组中.第1组、第2组、第3组、第5组的数据分别为2个、8个、15个、5个，则第4组的数据为（）.

A. 18个 B. 19个

C. 20个 D. 21个

7. 有40个数据，其中最大值为35，最小值为15.若组距为3，则应分成（）.

A. 5组 B. 6组

C. 7组 D. 8组

8. 为了描述一组数据的大小分布情况，通常可以画出数据的（）.

A. 条形图B. 扇形图

C. 折线图 D. 直方图

9. 已知一个样本：27，23，25，29，27，31，27，30，32，28，31，28，26，27，29，28，24，26，27，30.频数为8的范围是（）.

A. 24.5～26.5 B. 26.5～28.5

C. 28.5～30.5D. 30.5～32.5

10. 某次知识竞赛中，50名参赛者的得分（只记整数）分布情况如图1，从左到右小长方形的高之比为1 ∶ 2 ∶ 1 ∶ 4 ∶ 2.由图可知，分数在80.5 ~ 90.5之间的人数为（）.

A. 19 B. 20

C. 21 D. 22

三、解答题

11. 图2是某班学生一次数学统考成绩的频数分布直方图（每组含最大值但不含最小值），请回答下面的问题.

（1）全班有多少名学生？

（2）哪个分数范围的学生最多？

（3）如果成绩在79分以上算优良，那么获得优良的学生有多少名？

12. 为了考察一种零件的加工精度，从中抽出40件进行检测，其长度如下（单位：cm）：

161165164166160 158163162

168159147170167 151164159

152159149172162 157162169

156163164157163 165173159

157169165154153 163168159

请按组距为6将数据分组，列出频数分布表，画出频数分布直方图.

13. 某校为了进一步了解七年级学生的身体素质状况，体育老师对七（1）班50名同学进行了1min跳绳测试.以测试数据为样本，制出部分频数分布表（如表1）和部分频数分布直方图（如图3）.请结合图表完成下列问题.

表1

（1）表中的a = .

（2）请将频数分布直方图补充完整.

（3）已知七年级学生1min跳绳的标准为：x<120为不合格；120≤x<140为合格；140≤x<160为良；x≥160为优.根据以上信息，请你给该校七年级学生提出一条合理化建议.

14. 某班学生参加环保知识竞赛，将学生成绩（得分都是整数）进行整理后分成5组，绘制成频数分布直方图如图4（每组含最低分但不含最高分）.图中从左到右5个小长方形的高之比为1 ∶ 3 ∶ 6 ∶ 4 ∶ 2，最后一组的频数为6.请根据以上信息解答下列问题.

（1）该班有多少名学生参赛？

（2）成绩落在哪一组的学生最多？是多少？

（3）求成绩在60分以上（含60分）的学生人数占全班参赛学生总数的百分比.

（4）请你直接在直方图的基础上绘制频数折线图.

（答案在本期找）

【责任编辑：潘彦坤】

直方图算法篇3

红外图像是热辐射成像,由于场景中的目标与背景的温差相对较小,红外图像的动态范围大、对比度低,信噪比也较可见光图像的低。为了能够从红外图像中正确地识别出目标,必须对红外图像进行增强处理[1,2]。直方图均衡(HE)[3,4,5]是一种常用的图像增强方法,它根据图像的直方图分布信息进行灰度调整,以达到增强图像的效果。但由于红外图像自身的特点,一般的直方图均衡增强算法不适用于红外图像。为了克服直方图均衡化算法存在的不足,近几年出现了很多新的基于直方图处理的图像增强算法,其中以平台直方图算法(PE)[6,7]最具代表性,该算法基本上解决了直方图均衡化提升红外图像背景的缺点,但算法需要选择一个合适的平台值。不同的红外图像平台值的选择一般不相同,目前基本上是凭经验进行平台值的选择,这样就限制了算法的应用。自适应平台直方图均衡[8]是一个解决这个问题的有效方法。

针对上述问题,本文提出了一种基于直方图的自适应红外图像增强算法。该算法根据原始图像的直方图,自适应地构造出一个加权函数对原始图像的直方图进行加权处理,然后采用加权后的直方图对原始图像进行直方图均衡化。实验结果表明,算法对红外图像具有较好的增强效果,能够有效地抑制图像的背景,突出目标。

2 常用的红外直方图增强算法

直方图均衡化(HE)算法是图像增强中最常用、最重要的算法之一。该算法是把一幅已知灰度概率分布的图像,经过点变换使原始图像变成具有均匀概率分布的图像,从而使信息熵最大。对可见光图像,直方图均衡能达到相当好的增强效果。对于红外图像,由于背景所占灰度级较大,目标所占的灰度级较小,经过直方图均衡后,像素数多而且分布密集的背景灰度级之间的间隔变大,对比度得到了提高;像素数少、分布较稀疏的目标的间隔变小。这样反而提升了背景的对比度,减小了目标的对比度。因此直方图均衡(HE)增强算法不适用于红外图像增强。

平台直方图均衡(PE),是对直方图的一种修正。该算法通过选择一个合适的平台阈值P,在对图像直方图统计时,做如式(1)所示的修正。如果某灰度级的概率分布大于平台阈值P,将其概率分布置为P;如果其概率分布小于平台阈值P,就保持不变。其中h(rk)为原始图像的直方图。

平台直方图均衡化的本质是利用平台值适度限制背景和噪声灰度的增强,为目标细节的提升留出灰度空间,其图像增强效果和平台值P的选取直接相关,如果平台值选择合适,平台直方图均衡能够起到较好的增强效果[9,10],但算法需要选择一个合适的平台值,这就限制了算法的应用。

3 自适应直方图均衡

3.1 算法原理

对比度低的红外图像,其直方图分布集中,直方图中主峰所对应的灰度级往往是图像中的背景,当红外图像中的目标较小时,图像直方图的这种分布特点更加明显。基于上述事实,本文算法的基本思想是,先对图像的直方图进行加权处理,加权的结果使得原始图像的直方图主峰被平滑掉了,这样便为目标的增强留下灰度空间,然后根据加权后的直方图对图像进行直方图均衡化(HE)处理。

算法原理如下,设h(rk)为原始图像的直方图分布,w(x,T)为加权函数,其中T为一个参数集。首先,按式(2)统计原始图像的直方图得到h(rk),其中nk为灰度级为rk的像素总数。

根据h(rk)的性质,计算出加权函数w(x,T)的参数集T0,从而确定加权函数w(x,T0);然后用该函数对原始红外图像的直方图分布h(rk)进行式(3)所示的加权处理。

用加权后的直方图pr(rk),按式(4)求出每一灰度级的累计概率分布作为灰度变换系数(算法中取L=256)。

最后,根据灰度变换系数,按式(5)求出各像素点图像增强后的灰度值([]表示取整)。

3.2 加权函数

实验表明,红外图像的直方图分布主峰呈现指数型的形式,因此算法中所用的加权函数为指数型加权函数。加权函数的表达式为

加权函数中,a,b,c为三个可调参数。参数a决定函数“阻带”(即函数开口)的大小,参数b决定“阻带”的“位置”,随着b值的不同,加权函数的“阻带”可左右移动。参数c决定阻带的“深度”。当c取0时,算法退化为直方图均衡(HE),c越大时,对直方图的主峰削弱程度越大,c达到1时,可将整个主峰削掉。

加权函数的“阻带”宽度∆x与a的关系为

其中“阻带”宽度定义为函数exp(-x2/a)的幅值下降到峰值的处的宽度。

加权函数的作用如图1所示,由图中可见经过加权后,原始直方图中的主峰被“平滑”掉了,而直方图的其余部分基本未变。

3.3 加权函数参数的确定

加权函数的形状和位置由参数a、b、c决定,本算法中,通过对原始图像直方图分布的分析,来确定这三个参数。因此,加权函数的“阻带”位置、大小和深度会随着图像的直方图分布自适应地变化。最后加权的结果使得原始图的主峰被平滑掉。

参数的确定流程如下。首先搜索原始红外图像的直方图,得到其主峰的“位置”r0和“高度”h(r0)即式(8)所示。

根据h(r0),搜索直方图得到主峰的带宽∆r。(带宽定义为其幅值下降到峰值的处)。

然后,将加权函数的“阻带”位置、宽度与直方图的主峰“带宽”的位置、宽度相一致。即令:

可确定到a与b

加权函数阻带的“深度”,取决于原始图像直方图峰值的高度。显然,当图像直方图峰值较大时,加权函数的作用应增大;当直方图峰值较小时,加权函数的作用应减少,特别当直方图分布较均匀时,算法应退化为直方图均衡(HE)。基于上述思想,c的表达式为

其中h(r0)/∑rh(kr)是直方图峰值处的概率。经过实验,发现系数20有较好的增强效果。

4 实验结果及讨论

根据上述算法,对若干幅不同场景下的红外图像进行了增强实验。其中两幅图像的实验结果如图2所示。第一组图像是室内的人像,其直方图分布非常集中。分别对它用直方图均衡(HE)、平台直方图均衡(PE)(取平台值为120)和本文的算法进行处理。从图中可以看到,采用直方图均衡(HE),图像背景的噪声被放大了,增强的效果很不理想。采用平台直方图均衡(PE)算法,图像增强的效果要明显要好于直方图均衡(HE)。采用本文的算法增强,图像的背景被很好地抑制,细节增强效果(如衣服的邹折)优于平台直方图均衡(PE)。第二组图像是一座发电厂的远景图,相对第一组图,其直方图分布相对均匀一些,直方图中的主峰高度“较低”。从处理效果来看,直方图均衡(HE)使图像偏亮。本文的算法与平台直方图均衡(PE)(取平台值为100)相差不大。

总的来看,当图像的直方图分布非常集中时(直方图中有较高的主峰),本文算法的增强较果要优于选定阈值的平台直方图均衡。当图像直方图中主峰较低时,本文算法的增强较果与选定阈值的平台直方图均衡相差不大。特别的,当图像的直方图分布均匀时,本文的算法会退化为直方图均衡(HE),图像增强的效果与直方图均衡(HE)几乎一样。

结束语

实验结果表明,本文提出的自适应直方图均衡算法,克服了一般直方图均衡算法的缺点,能够自适应地对原始图像进行直方图均衡。从实验效果来看,整个算法对红外图像具有较好的增强效果,可较好地抑制图像的背景,突出目标。将此算法硬件化将是进一步的研究内容。

参考文献

[1]刘志才,李志广.红外热像仪图像处理技术综述[J].红外技术,2000,2(6):27-32.LIU Zhi-cai,LI Zhi-guang.A Review on Image Process Technique of Thermal Imager[J].Infrared Technology,2000,2(6):27-32.

[2]赵耀宏,向伟,罗海波,等.SOPC技术在实时红外图像处理中的应用[J].红外与激光工程,2005,34(6):745-751.ZHAO Yao-hong,XIANG Wei,LUO Hai-bo,et al.The application of SOPC technology in real-time infrared image processing[J].Infrared and laser Engineering,2005,34(6):745-751.

[3]Rafael C Gonzalez,Richard E Woods.Digital Image Processing(second edition)[M].Beijing:Publishing House of Electronics Industry,2002:88-94.

[4]Stark J Alex.Adaptive image contrast enhancement using generalizations of histogram equalization[J].IEEE Trans.Image Process,2000,9(5):889-896.

[5]Lau S S Y.Global image enhancement using local information[J].Electron.Lett,1994,30(2):122-123.

[6]Vicker V E.Plateau equalization algorithm for real time display of high quality infrared imagery[J].Opt.Eng,1996,35(7):1921-1926.

[7]Silverman J,Mooney J M,Vickers V E.Display of wide dynamic range infrared images from PtSi Schottky barrier cameras[J].Optical Engineering,1990,29(2):97-104.

[8]WANG Bing-jian,LIU Shang-qian,LI Qing,et al.A real-time contrast enhancement algorithm for infrared images based on plateau histogram[J].Infrared Physics&Technology,2006(48):77-82.

[9]陈洪,常青,郭天天,等.一种易于硬件实现的红外图像实时增强算法[J].红外与激光工程,2004,33(3):282-287.CHEN Hong,CHANG Qing,GUO Tian-tian,et al.Real-time infrared image enhancing algorithm easy to implement[J].Infrared and Laser Engineering,2004,33(3):282-287.

频数分布直方图之应用篇篇4

接下来，我将给大家举几个实例来进行频数分布直方图与普通统计图间的比较，并得出频数分布直方图所具有的优异，从而解决以上这个疑惑。

实例一：频数分布直方图

某班共有44名学生，为了解他们的身高情况，进行了普查，并绘制成了一下这幅频数分布直方图。

从以上这幅图中我们可以知道频数分布直方图就是一目了然地把这些问题图表化处理的工具，它通过对收集到的貌似无序的数据进行处理，来反映调查的分布情况，可以清楚显示各组频数分布情况和各组之间频数的差别。

其实它看起来与条形统计图非常相近，但最主要的区别在于：它可以不仅可以表示资料的具体数值，也可以表示资料变化情况。因此它解析出规则性，对于资料分布状况一目了然，便于判断其总体质量分布情况。

小结：频数分布直方图适合既需要体现数据的具体数据，也需要呈现数据变化数据的情况，例如在质量管理中，预测并监控产品质量状况就可以用到它。

实例二：条形统计图

某地为了解本地近几年来的气候变化，统计了2002年——2006年的降水量，以便得出结论。因此，研究人员根据调查所得的数据，绘制了一下这幅条形统计图。

从这幅图中，我们可以清晰地看出从条形统计图中很容易看出各种数量的多少，当然，这也就是这种统计图最大的目的。与频数分布直方图相比，条形统计图不能体现出数据的变化情况，但是它对于数据的展现显得更加的具体，但它的数据种类不能太多，否则数据就会显得过于分散。

直方图算法篇5

随着多媒体技术和网络环境的发展, 以各种方式获取的图像数据增长迅猛, 图像检索日渐成为引人关注的课题之一。传统基于文本检索方案的检索, 由于文字很难完全表达图像的丰富内容, 同时人工标注工作量大且具有主观性。因此, 对图像的检索更多地希望在内容基础上进行。图像的物理特征为基于内容的图像检索提供了很好的基础[1]。

根据使用的图像特征不同, 图像检索可以分为色彩方法、纹理方法和形状方法。计算图像的色彩特征更方便、快速, 因此色彩方法是图像检索中常用的方法。图像的颜色直方图是图像中各种色彩出现的频率, 它反映图像的颜色特征, 而且不因图像的几何变换而改变, 是检索中经常使用的特征[2]。颜色索引技术 (color indexing) 作为一种图像相似检索方法最早在文献[3]中提出, 它的核心思想是计算图像的颜色分布, 即颜色直方图 (color histogram) , 并利用直方图相交算子 (histogram intersection) 计算图像之间的相似度。然而, 如文献[4]中所分析的那样, 直方图方法存在诸多缺陷, 例如可能会有两幅完全不一样的图像却具有完全相同的颜色直方图, 即颜色直方图没有考虑图像的颜色空间分布信息。为了克服直方图方法中出现的这种问题, 本文提出对检索图像和数据库图像先用直方图进行检索, 然后再根据直方图检索没有考虑颜色的空间分布信息这一局限性, 引入了一个描述颜色空间关系的一维矢量, 提高了彩色图像检索的性能。

1直方图检索算法

对于选择的数据库图像和查询图像, 分别提取R、G、B三个颜色分量的统计直方图, 即:

H (k) =nk/n, k=0, 1, …, L-1 (1)

其中k代表图像的特征取值, L代表特征可取值的个数, nk是图像中具有特征值为k的像素个数, n是图像像素的总数。

采用直方图相交算法作为距离度量 (D代表数据库图像, Q代表查询图像) :

undefined (2)

用公式 (2) 分别计算查询图像各颜色分量与数据库图像各颜色分量的统计直方图相交距离, 用Pr、Pg、Pb分别表示查询图像与数据库图像之间的红色、绿色、蓝色分量的距离 (可以是直方图相交距离或其它方法计算出来的距离) 。依据所选择的示例图像和数据库图像在颜色分配上的不同情况给Pr、Pg、Pb分别选定不同的权重作为最后的相交距离, 即:

P (Q, D) =WrPr+WgPg+WbPb (3)

其中Wr、Wg、Wb分别表示红色、绿色和蓝色分量的权重 (加权系数) , 且有Wr+Wg+Wb=1。

这里我们选取由红色小汽车所组成的图像库, 在检索时, 将Wr、Wg、Wb分别取不同的值, 得到的检索结果如下 (Wg、Wb取值相同) :

针对Wr的不同取值, 在同一个坐标系里画出其PVR曲线, 如图4所示:

从图4中我们可以看到:Wr取值越大, 检索性能相对越好。其原因是所选取的图像库是红色为主的。对于不同的图像库, 要针对实际情况给予不同的选取。

2方法的改进

众所周知, 直方图检索虽然不受旋转和平移变化的影响, 但没有表达出颜色的空间分布信息。因此, 如果在一般颜色直方图的基础上加入对像素空间分布的统计[5], 即可将空间和颜色特征相结合。

对于一幅彩色图像, 这里引入了一个一维特征矢量C (k) , 它表示所有具有颜色k的像素的数目。设两个像素pi和pj之间的距离为d (pi, pj) , 这里的距离定义为欧氏距离:

undefined (4)

其中 (xi, yi) , (xj, yj) 分别表示像素pi和pj的坐标。

从具有颜色k的像素到所有具有颜色k的像素的平均距离定义为:

undefined (5)

这个平均距离可以看作像素pi的一个特征, 表达了像素pi与其它具有颜色k的像素的远近程度。

对于真彩图像, 其每一种颜色分量都是256级的, 即每一种颜色分量的像素值都在0到255之间变化。因此, 对于所选取的查询图像和数据库图像的每一种颜色分量, 在用公式 (5) 计算像素间的平均距离之后, 得到的是256个平均距离。将这组平均距离表示成一维向量的形式:

V= (m0, m1, m2, …, mk, …, m255) (6)

其中mk表示所有具有颜色k的像素值的平均距离。

在引入了一维的空间关系特征矢量之后, 对所选取的查询图像和数据库图像进行相似匹配时, 采用欧式距离为相似度量的标准:

其中mQi、mDi分别代表查询图像和数据库图像的颜色值为i的像素的平均距离。

3结合颜色空间的直方图检索算法

引入了表达颜色空间分布关系的一维矢量之后, 对于彩色图像的检索过程可以描述为:

(1) 对于一幅真彩的RGB查询图像, 分别提取其三个颜色分量R、G、B的统计直方图。

(2) 对于每一个颜色分量的一个具有特定的颜色k的像素, 统计所有具有颜色k的像素的数目, 再根据公式 (4) 、 (5) 分别计算该分量中所有具有颜色k的像素与其的平均距离, 并将此平均距离按照公式 (6) 排列成一维向量的形式。

(3) 对数据库图像也与查询图像一样做同样的处理。

(4) 用公式 (7) 分别计算查询图像和数据库图像的各颜色分量所引入的一维空间关系矢量的相似距离。

(5) 将查询图像和每一幅数据库图像各颜色分量统计直方图用直方图相交算法 (2) 计算它们之间的相交距离。

(6) 这里选取由红色小汽车构成的图像库, 红色分量的权重应该增大。因此, 在确定最后的相交距离时, 规定颜色特征和空间关系特征所占据的位置相同, 即各占50%, 而且对于颜色特征和空间关系中的红色分量的权重占各自特征的90%, 而绿色和蓝色分量的权重相同, 即用公式 (3) 分别计算直方图相交距离和空间关系距离, 再将这两个距离取加权平均得到最后的距离。

(7) 将用Wr=0.9, Wg=Wb=0.05的直方图方法检索出来的结果和引入空间关系之后的检索结果按相似性排列如图5和图6所示 (相似性从左到右、从上到下降序排列) :

4检索结果的比较

为了测试在加入颜色的空间分布信息时, 检索性能的优越, 在同一坐标系里分别作出了它们的PVR曲线如图7所示。

由图7可知, 加入了颜色的空间分布特征后的检索, 查全率和查准率都有了一定程度的提高。但是, 在检索过程中可以发现, 由于加入了对图像的各颜色分量的像素的统计和平均距离的计算, 增加了检索时间。因此, 对于图像检索系统来说, 如果要求检索精度高而对检索时间的要求不高时, 本文提出的方法是很有效的。

参考文献

[1]王海霞, 覃团发.综合MPEG-7中颜色特征的图像检索方法[J].计算机应用研究, 2005, 3:164-168.

[2]王宇生, 陈纯.一种新的基于色彩的图像检索方法[J].计算机研究与发展, 2002, 39 (1) :105-109.

[3]Swain M J, Ballard D H.Color indexing[J].Internation-al Journal of Computer Vision, 1991, 7 (1) :11-32.

[4]Androutsos D, Plataniotis K N, Venetsanopoulos A N.ANovel Vector-Based Approach to Color Image RetrievalUsing a Vector Angular-Based Distance Measure[J].Computer Vision and Image nderstanding, 1999, 75 (1/2) :46-58.

直方图算法篇6

图像检索所用到的基本特征主要为颜色、纹理、形状、轮廓、空间关系等, 纹理、形状、轮廓等特征经常被使用, 但是没有确切的定义, 且比较复杂。颜色是图像的最显著特征, 也是人识别图像的主要感知特征。它具有视觉最显著、最可靠、最稳定的效果, 而且还具有旋转不变性和尺度不变性, 因此被广泛使用。基于颜色特征的表示方法很多, 其中直方图方法是最常用的方法之一。

1 传统的全局颜色直方图算法

使用颜色直方图作为图像内容的检索特征, 首先要确定颜色的种类, 即将颜色空间划分成若干个固定的子空间;然后计算每幅图像的颜色直方图, 即对每幅图像统计属于各个颜色子空间的象素的比例;最后是图像之间的相似度计算。具体步骤如下:

1.1 计算颜色直方图

给定的一幅图像 (fxy) M×N, fxy表示像素点 (x, y) 处颜色值, M×N表示图像的尺寸, 图像所包含的颜色集记为C, 则图像的颜色直方图可表示如下:

1.2 相似度计算

这里介绍一种常用的矩离算法是Swain和Ballard提出的直方图相交法。设查询图像为I, 目标图像为Q, 则矩离为:

颜色直方图作为一种重要的基于颜色特征进行图像检索的方法, 具有特征提取和相似度计算简便, 并且随图像尺度、旋转等变化不敏感的特点。但颜色直方图描述的是图像颜色的统计特性, 丢失了图像颜色的空间分布信息。

2 一种改进的颜色直方图法

为了在图像的颜色直方图中包含图像颜色的空间分布信息, 我们将图像的边缘信息融入到图像的颜色直方图中。设Δ (i, j) 表示在像素 (i, j) 处的拉普拉斯算子, Constantium等提出了下述改进的加权颜色直方图:

当式中α=0时, 退化为传统的直方图;当α<0且k≠0时, 属于连续区域内的像素得到了加强;当α>0且k→0时, 属于图像边缘的像素得到了加强。

3 基于九分块的颜色直方图算法及具体实现

3.1 颜色空间的转换和颜色量化

由于人的视觉对亮度的敏感程度远强于对颜色浓淡的敏感程度, 为了便于色彩处理和识别, 人的视觉系统经常采用HSV色彩空间, 它比RGB色彩空间更符合人的视觉特性, 它由色度H、饱和度S、亮度V, 3个分量组成。由于这种模型具有线性伸缩性, 可感知的色差与颜色分量的相应样值上的欧儿里德距离成比例。因此HSV颜色模型比RGB颜色模型更直观、更客易接受。它与RGB颜色模型关系如下:

其中色度H的取值范围 (0°~360°) , 饱和度S的取值范围 (0~1) , 亮度V的取值范围 (0~1) 。

为简化计算, 我们采用文献 (孙君顶等2006) 提出的将图像的颜色量化为13个级别, 量化方法如下表:

3.2 基于九分块的颜色直方图算法

a.首先将图像平均分割成9块, 如下图所示

设查询图像和将进行比较的目标图像分别为I和Q, 则

I=I1+I2+I3+I4+I5+I6+I7+I8+I9,

Q=Q1+Q2+Q3+Q4+Q5+Q6+Q7+Q8+Q9。

b.再将图中各部分看作独立的图像, 分别计算出I图的九部分颜色直方图:

{H (I1) , H (I2) , H (I3) , H (I4) , H (I5) , H (I6) , H (I7) , H (I8) , H (I9) }

和Q图的九部分的颜色直方图:

{H (Q1) , H (Q2) , H (Q3) , H (Q4) , H (Q5) , H (Q6) , H (Q7) , H (Q8) , H (Q9) }。

c.最后根据直方图相交法, 将I图的九部分颜色直方图和Q图的九部分的颜色直方图两两相交计算小图间的距离, 得到下面的矩阵D9×9

D9×9的任意一行或列表示该行所在的小图与另外图像的三九幅小图比较所得的距离值, 取其每行或每列的最小值即可表示该小图与另外图像的九幅小图比较相似度最大值。

L (Ii) =min{D[i][j]|j=1, 2, 3}

Q (Ii) =min{D[i][j]|i=1, 2, 3}

将整图中九个小图与另一幅图的小图比较后得到的最小值求和得到的值作为两幅整图的相似度, 为了防止个别小图对整个大图的影响过大, 取最大值做为图像之间的最终相似度。

4 实验及结果

基于上述思想, 本文实现了一个原型系统。该系统的环境为:Genuine Inter (R) CPU T2050@1.60GHz, Windows XP 512M内存。在原型系统的基础上, 设计了三个实验: (1) 作基于传统直方图法的图像检索; (2) 作基于一种改进的直方图法的图像检索; (3) 作本文所研究的基于九分块的颜色直方图法的图像检索。实验所采用的测试图像数据库是corel图像库中的corelimg2文件夹中的312幅图像, 其中有关大型巴士的图像88幅, 有关恐龙和大象的各100幅, 还有有关花朵的24幅。实验中, 我们做了两组检索, 从测试图像数据库中抽取了一幅巴士图像和一幅花朵图像, 分别用上述三种算法做了一次检索, 每一次检索, 系统返回14幅相似图像。以下是实验结果。

当以花为检索图像时:, 如图1、图2、图3所示。

当以巴士为检索图像时, 如图4、图5、图6所示。

从检索结果明显可以看出, 改进的颜色直方图法比传统颜色直方图法要好很多, 基于九分块的颜色直方图查准率最高, 效果最好。

5 结语

基于九分块的图像检索算法, 考虑了图像颜色的空间信息, 实验证明有很高的查准率, 但由于它的庞大的计算量使得计算速度比较低。下一步工作就是通过研究一种改进的索引技术或通过其它方法来提高检索速度。

参考文献

[1]Swain M J, Ballard D H.Color indexing[J].International Journal of Computer Version, 1991, 7 (1) :11-32

[2]孙君顶, 赵珊.图像低层特征提取与检索技术[M].北京:电子工业出版社, 2009.

[3]黎洪松.数字视频处理[M].北京:北京邮电大学出版社, 2006.

[4]James Z Wang.Integrated Region-Based Image Retrieval[M].Boston:Kluwer Academic Publishers, 2001.

直方图算法篇7

图像增强是图像处理最基本的手段[1]。图像增强的目的,是通过对图像灰度作修正,提高图像的对比度,改善图像的视觉效果。当前一些对比度增强方法,如全局直方图均衡化、自适应局部直方图均衡化等,常用于医学、军事或高端数字电视等领域。这些算法比较复杂,不易ASIC实现。在视频处理中,为了能够实时调节图像的对比度,通常使用一个与对比度调节系数以及阈值有关的函数来修改直方图。普通消费类产品中,图像增强多采用自适应线性变换。但线性拉伸中存在图像亮度过渡的不自然,整体变暗的拉伸视觉效果不佳等问题。

基于视频处理的实时性和处理效果的综合考虑,本文采用基于亮度直方图分段非线性拉伸的方法,对图像进行增强处理。主要利用直方图统计生成亮度调整曲线来改变图像亮度,并引入色度信息辅助修正直方图的拉伸曲线,调整图像对比度。同时根据亮度的调整比例适当调整图像色度,进一步改善图像效果。通过与线性拉伸对比,本文算法不但在处理效果上有较明显提升,而且简化了硬件实现。YCbCr颜色空间[2]具有与人视觉感知的一致性,以及亮度和色度相互独立的特点,本文处理均基于YCbCr颜色空间。

1 分段线性变换

图像增强处理时,为了突出感兴趣的目标或灰度区间,可采用分段线性变换。它把整个灰度区间划分成几个灰度区间,拉伸要增强目标对应的灰度区间,相对抑制不感兴趣的灰度级,从而达到增强的目的。常用的是三段线性变换[3],如图1所示。数学表达式为:

g(x,y)=

undefined

式中M为图像最大亮度。通过调节折线拐点的位置及分段直线的斜率, 即控制参数a、b、c、d的取值,可实现对任一灰度区间的扩展或压缩。

这种方法简单,而且对于一般的图像确有一定的效果, 但它存在一些不足,该方法对于原图中的整个灰度级映射的变化率不同,但在具体某段灰度区域内是相同的。实际中,人们也希望在具体某段灰度区域内也是不同的, 这样在各图像区域内的对比度也能有所增强。

2 分段非线性拉伸的新算法

研究中发现,如图2所示,直方图的形状可以看成由图3中Ⅰ和Ⅱ两种基本形状组合构成。而对于其中任何一种三角形,只要一个弧线就可以实现对其拉伸。因此可以把直方图划分为多个亮度段,对任一段Hi、Hi+1、Hi+2都可以根据3个值的高度排列来判断该亮度段属于哪种类型的三角形或者三角形的组合(图3中Ⅲ型和Ⅳ型),如图4所示。根据三角形的形状特征在曲线表(curve LUT)中选者适当的曲线作为该亮度段的亮度调整曲线。然后把各亮度段的曲线组合起来,就得到了整个亮度的调整曲线。根据该曲线修改图像亮度,就可以实现直方图拉伸。

本文选用y=xn来对直方图进行非线性拉伸,如图5所示。为方便硬件的实现,存储(0,10,20,30,40,50,60)等7个点的值,其他点则有这些点构成的折线插值得到。对参数n<1和n>1分别取6条曲线,每条曲线存储7个点;这样由两种极性、6种幅度共12条曲线,构成小曲线查询表,如表1-2所示。

本文详细介绍算法各部分的具体实现原理,重点研究如何生成合适图像的调整曲线。

2.1 直方图统计及分段

对一幅图像进行直方图统计,生成一个11段的直方图如图6所示,只统计16～35、36～55、56～75、76～95、96～115、116～135、136～155、156～175、176～195、196～215、216～235等11个亮度范围的亮度点数H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11,作为11段直方图。把以上11段直方图划分为低、中偏低、中、中偏高、高等五个亮度段[4],分别对应亮度16～75、56～115、96～155、136～195、176～235。为了方便硬件实现,把低亮度段扩展为16～76,把中低亮度段扩展为56～116,把中亮度段扩展为96～156,把中高亮度段扩展为136～196,高亮度段扩展为176～235。每个亮度段对应0～60的长度。

2.2 曲线的选择与合成

曲线的选择与合成是本算法的核心。首先比较每一亮段中Hi、H1+1、Hi+2大小,并与模板对照,便可以得到相应直方图模型为Ⅰ、Ⅱ、Ⅲ或Ⅳ型。例如,如果HiHi+2,则可以判定这段亮度的直方图模板为Ⅳ型。再由一定原则生成该段直方图的小亮度转换曲线。

(1)Ⅰ和Ⅱ型亮度段的曲线选择。

首先对每一亮度段中Hi、H1+1、Hi+2按由小到大排序得到A、B、C,其中C≥B≥A。本文分别对C/(A+B)、C/A以及C/(A+16)的值设置3个门限,根据这些值所处的区间,再来选择相应幅度的曲线。

在曲线的选择中,本文还引入色度的近似饱和度S=|Cb-128|+|Cr-128|,因为颜色鲜艳的图像S均值很大[5],而且这类图像一般不需要较大的调整。对S均值设置一个门限TS,如果S>TS,则选用调整幅度较小的一组曲线:curve-1-curve-4;如果S

(2)Ⅲ型亮度段的曲线合成。

Ⅲ型亮度段的曲线可以由图4中分别对应Ⅰ和Ⅱ型三角形的弧线组成,只要前半段为Ⅰ型,后半段为Ⅱ型即可。

对于前半段,本文对Hi/H1+1值设置三个门限,K11,K12和K13,根据Hi/H1+1的值在Ⅰ型中选者一条曲线,curve-a=[P11、P12、P13、P14、P15、P16、P17]。同理对于后半段,对Hi/H1+1值设置三个门限,K21,K22和K23,根据Hi+2/H1+1的值在Ⅱ型中选择一条曲线,curve-b=[P21、P22、P23、P24、P25、P26、P27]。

由于两段曲线都是对应[0、10、20、30、40、50、60],同时将curve-a映射到[0、5、10、15、20、25、30],把curve-b映射到[30、35、40、45、50、55、60],即可结合到一起。这样[0、P12/2、P13/2、P14/2、P15/2、P16/2、30、30+P22/2、30+P23/2、30+P24/2、30+P25/2、30+P26/2、60]就是对应[0、5、10、15、20、25、30、35、40、45、50、55、60]的点。为了与其他曲线统一,本文抽取它的一般,即[0、10、20、30、40、50、60]的点,可以得到[0、P13/2、P15/2、30、30+P23/2、30+P25/2、60]。

(3)Ⅳ型:

本类型曲线和Ⅲ型形成方法完全一样,差别只是Ⅳ型的前半段选Ⅱ,后半段选Ⅰ。在此不再详细叙述。

2.3 亮度调整小曲线的拟合

由于低、中偏低、中、中偏高、高每段的曲线均由7个点组成,而且都取0～60的范围,相互有长度为20的重合区域,因此相邻两段亮度曲线的组合比较简单。由查询表得到五段亮度对应曲线分别为:

curve-low=[PL1、PL2、PL3、PL4、PL5、PL6、PL7],

curve-lm=[PLM1、PLM2、PLM3、PLM4、PLM5、PLM6、PLM7],

curve-mid=[PM1、PM2、PM3、PM4、PM5、PM6、PM7],

curve-mh=[PMH1、PMH2、PMH3、PMH4、PMH5、PMH6、PMH7],

curve-high=[PH1、PH2、PH3、PH4、PH5、PH6、PH7]。

首先,由于curve LUT是在0～60亮度范围内建立,分别对应16～76、56～116、96～156、136～196、176～236,所有需要修正的曲线为:

(a) new-curve-low=curve-low+16,

(b) new-curve-lm=curve-lm+56,

(d) new-curve-mh=curve-mh+136,

(e) new-curve-high=curve-high+176。

在曲线重合的3个点按照一定的原则加权平均,得到曲线的23个点:[PL1+16、PL2+16、PL3+16、PL4+16、PL5+16、{(PL6+16)+(PML2+56)}/2、PML3+56、PML4+56、PML5+56、{(PML6+56)+(PM2+96)}/2、PM3+96、PM4+96、PM5+96、{(PM6+96)+(PMH2+136)}/2、PMH3+136、PMH4+136、PMH5+136、{(PMH6+136)+(PH2+176)}/2、PH3+176、PH4+176、PH5+176、PH6+176、PH7+176],分别对应亮度[16、26、36、46、56、66、76、86、96、106、116、126、136、146、156、166、176、186、196、206、216、226、236]转换后的值。利用这23个相邻间距为10的点插值求出每个亮度转换后的值来修改图像亮度。

上述方法生成的高亮度段小曲线亮度范围为176～236,而实际处理的为16～235。因此要对高亮度段曲线作特殊处理,让其通过(235,235)这个点。只要改变折线7个点最后一个点的位置,就可以使折线经过此点,所以,对curve LUT中每条曲线都多存储一个点。如果当前是生成高亮度段的小曲线,则使用这个额外的点作为输出线的最后一个点。

2.4 亮度及色度调整模块

在对比度增强中,调整亮度的同时,通常按照亮度调整的比例修改色度,这样图像才不会出现失真。

3 硬件实现

为了检验此算法运用到实际硬件系统中的实时处理性能,在一个以FPGA为核心的实时视频处理平台上实现了该算法,硬件的设计采用了Verilog硬件描述语言。图7为该算法的硬件结构框图,输入数据的格式为4∶2∶2的YCbCr数据,功能模块的划分基本上与算法的步骤相对应。

该硬件结构的核心是各个亮度段的小曲线生成模块。本文给出本模块硬件结构图,如图8所示。本算法中,色度近似饱和度门限值TS、以及在模板选择中的门限(T11、T12、T13、T21、T22、T23、T31、T32、T33),曲线选择中的门限(K11、K12、K13、这些参数通过I2C总线来实现参数的实时修改: 在硬件系统中由6个寄存器来存储这16个参数的值。这些寄存器都连接到系统的I2C接口模块上,可通过I2C总线实时修改寄存器中的值。在FPGA硬件仿真平台上得到的测试图片结果与算法仿真结果几乎一致,且能达到较好的增强效果。此外,由于算法的硬件实现容易,硬件实现代价较小。

4 仿真验证与总结

通过软硬件仿真证明, 把这一增强方法具体应用于视频图像的增强处理, 取得了较好的处理效果。图9为对图像增强处理的实例,变换后图像的对比度得到了增强,与分段线性拉伸相比,图像均匀过渡,避免出现折线分段拉伸中图像亮度过渡的不自然;使整体变亮或变暗的拉伸视觉效果均得到改善。

参考文献

[1]冈萨雷斯.数字图像处理[M].2版.阮秋琦,译.北京:电子工业出版社,2003:59-86.

[2]PHUNG S L,BOUZERDOUM A,CHA ID.A novel skin color modelin YCbCr color space and its application to human face detection[C].Proc of International Conference on Image Processing,2002:289-292.

[3]杨词银,黄廉卿.基于正弦灰度变换的X光图像增强[J].光学技术,2002,28(5):407-409.

[4]张长江,汪晓东,张浩然.图像对比度增强的非线性变换法[J].光电工程,2006,33(6):65-68.

基于极坐标直方图的图像检索算法篇8

在基于内容的图像检索中, 首先是提取图像中的特征, 如颜色、纹理、形状等;然后再根据这些特征进行检索。特征类型的选择, 以及特征的提取与表示方法, 关系到图像检索系统的效果和效率。由于人类视觉在辨别物体的时候, 最容易根据目标的形状来区分物体, 因此形状特征备受关注[1]。形状特征的描述方法有很多, 但总的来说可归结为两类:基于区域的方法和基于轮廓的方法[2]。一般认为, 基于轮廓的描述子性能好于其他形状描述子, 具有稳定、提取速度快、包含更多目标形状信息的特点, 是识别特征的首选[3,4,5]。

在基于轮廓的图像检索方法中, 距离直方图[6]是一种常用的轮廓描述方法。但是, 由于距离直方图只描述了距离的统计特征而忽略了轮廓的空间信息, 因而具有较高的误检率。为解决该问题, 文献[7]提出了一种距离聚合向量的方法, 即在距离直方图的基础上将每个区间里的像素分为聚合和非聚合;文献[8]在提取轮廓角点的基础上采用角点特征作为轮廓索引。文献[9]提出使用形状上下文作为轮廓的形状描述符;文献[10]提出了利用边缘方向自相关图作为形状描述符。但由于上述方法在描述轮廓特征时, 忽略了轮廓形状的变化信息, 没有考虑到不同类型的点对形状作用的不同, 将所有轮廓点同等对待;并且只采用轮廓距离信息, 忽略了轮廓的空间信息, 导致检索结果不精确。本文提出了一种新的基于极坐标直方图的轮廓形状描述与图像检索算法以提高检索结果的精确性。实验结果表明本文算法具有旋转、尺度和平移不变性, 提高了检索的准确率和查全率。

2、形状描述符的构造

对基于轮廓的图像检索技术来说, 目标的形状可以通过轮廓的提取或图像分割的方法获得, 例如轮廓跟踪。为了形成具有较强鲁棒性的形状描述符, 本文首先对跟踪后的轮廓进行平滑操作, 得到一个光滑的曲线;然后提取均匀采样点和尖点作为轮廓特征点, 并分别向轮廓质心引向量得到特征向量集;最后统计特征向量集的距离和方向得到极坐标直方图, 再根据这个直方图来描述目标形状。

2.1 特征点提取

(b) 图 (a) 的尖点极坐 (c) 图 (a) 的均匀采样点 (a) 山西省地图标直方图极坐标直

尖点定义为曲线上局部曲率极大值的点。均匀采样点定义为轮廓作定数等分采样得到的点。尖点能够很好地描述轮廓的形状, 是形状识别中的重要特征, 而其它轮廓点同样含有丰富的信息;因此本文在提取尖点的同时又提取了均匀采样点作为描述轮廓形状的特征点。

2.1.1 均匀采样点的提取

本文将轮廓上曲率最大的点确定为均匀采样的起始点。如果轮廓有不止一个曲率最大点, 则比较曲率最大点的相邻点的曲率, 然后取相邻点的曲率也较大的点所对应的曲率最大点作为起始点, 如果相邻点的曲率也相同则再比较相邻点的相邻点曲率, 直到找出较大的相邻点为止。

2.1.2 尖点的提取

由于轮廓点p (i) 坐标是由x (i) 和y (i) 共同决定的, 因此, 只要分别找出x (i) 、y (i) 上的尖点, 将其合并即得到轮廓p上的尖点。

首先计算x (i) 和y (i) 上各点的曲率绝对值q (i) , 具体计算如下:在数值分析中, 对于离散函数x=x (i) , i=2, 1, ...n为等距点, 由插值原理得:

其中h为步长, 即计算曲率所用到的相邻像素点数。

曲线上的二阶导数近似等于该点的曲率, 设x (i) 上的第i点的曲率为ρ, 则有:

设q=h2ρ, 则有:

步长h大小的选取直接影响着曲率计算的精度, h的值太大或太小都会导致轮廓上出现许多曲率相同的点。实验中发现当h取5时效果比较理想。

2.2 特征向量集

为了计算特征向量集, 需要计算轮廓的质心c (x0, y0) , 其定义如下:

其中 (xi, yi) 为轮廓上的点坐标, m为轮廓点的个数。

特征向量定义为由特征点向轮廓质心所引向量。所有特征向量的集合称为特征向量集。

2.3 极坐标直方图

与一维距离直方图相比, 作为二维直方图的极坐标直方图, 在考虑距离信息的同时还引入方向信息, 因而更适合用于轮廓形状的描述。

2.3.1 极坐标转换

一般图像中像素的位置可以用笛卡尔坐标 (x, y) 表示, 也可以用极坐标 (r, θ) 表示。若将极坐标原点置于轮廓质心, 则将笛卡尔坐标转换为极坐标的公式如下:

本文只需对特征点的坐标进行转换, 式中 (x, y) 为轮廓上的特征点的坐标, (x0, y0) 为轮廓质心点的坐标, (γ, θ) 为极坐标中的变量。

2.3.2极坐标直方图

为了求取极坐标直方图, 需要将极坐标平面量化。量化刻度的粗细将影响描述精度和计算速度。通常量化刻度越细, 描述精度越高, 计算量越大;反之量化刻度越粗, 描述精度越低, 计算量越小。将γmax等分为5份, 其中γmax为γ的最大值, θ等分为12份, 其描述精度和计算速度都比较理想。图1给出了山西省地图尖点和均匀采样点的极坐标直方图h (k) 和g (k) , k为直方图的采样区间。

3、相似度测量

图像间的相似性用相应特征直方图之间的距离度量, 而轮廓的总体特征可表示为{h (k) , g (k) }, 其中h (k) 和g (k) 分别表示尖点和均匀采样点所对应的极坐标直方图。直方图间的距离, 定义如下:

其中c1, c2表示任意两个图像的轮廓曲线, 1D, D2为尖点和采样点所对应的直方图的距离。

轮廓间相似度定义如下:

其中ω为特征向量的权值。由于尖点较均匀采样点更能表述轮廓形状, 所以ω取值时应满足ω>0.5 (本文实验中取0.6) 。由公式 (9) 可得, D越小, 相似度越高。

4、实验结果

本文选取MPEG-7测试库中的20类400幅图像作为实验图像库。图2给出了部分语义图像集的示例图像及数目。

为了进一步验证本算法的优越性, 本文进行了3种算法、4类示例图像的检索效果对比实验。图3、图4以及图5分别给出本文算法及其他两种算法的检索结果, 每幅图的左边第一幅图像为待检索图像也是图像库中存在的图像。

由实验结果可得, 本文提出的算法检测出了每类图像中的相似图像, 具有非常好的平移、旋转和尺度不变性, 提高了检索的准确度和查全率。

5、结语

本文针对形状轮廓的描述问题, 提出了一种新的基于极坐标直方图的轮廓形状描述与图像检索算法。该方法采用尖点和均匀采样点作为特征点, 利用极坐标直方图作为形状描述符, 既包含了轮廓的统计特征, 又包含了空间分布特征, 具有尺度、旋转和平移不变性的特点, 实验证明了本文算法的有效性。

摘要：提出了一种新的基于极坐标直方图的轮廓形状描述与图像检索算法。提取轮廓中能够反映轮廓形状特征的尖点和均匀采样点;分别将两类特征点向轮廓质心引向量得到两个特征向量集;最后利用两个特征向量集得到的两类极坐标直方图构造目标形状描述符。实验结果表明, 该算法不仅能够很好的描述相关形状的轮廓特征, 而且其特征描述具有尺度、旋转、平移不变性, 同时提高了图像检索的准确率和查全率。

关键词：图像检索,形状描述,极坐标直方图,特征向量集

参考文献

[1]Zhang D S, Lu G J.Study and evaluation of different Fouriermethods for image retrieval[J].Image and Vision Computing, 2005, 23 (1) :33-49.

[2]Zhang D S, Lu G J.Preview of shape representation and de-scription techniques[J].Pattern Recognition, 2004, 37:1-19.

[3]Mokhtarian F, Bober M.Curvature scale space representation:theory, applications, and MPEG 7 standardization[M], Newyork:Kluwer Academic Publisher, 2003.

[4]Latecki L, Lakamper R, Eckhardt U.Shape descriptors for non-rigid shapes with a single closed contour[A].IEEE Conf.ComputerVision and Pattern Recognition (CVPR) [C].2000, 424-429.

[5]束鑫, 吴小俊, 潘磊.一种新的基于形状轮廓点分布的图像检索[J].光电子.激光, 2009, 20 (10) :108-112.

[6]孙君顶, 李泉溪, 毋小省.一种新的轮廓特征提取和检索算法[J].光电子.激光, 2009, 20 (1) :108-112.

[7]Sajjanhar A, Lu G J, Zhang D S, Coherence Based Histograms forShape Retrieval[A].In Proc of International Conference onComputer Science, Software Engineering, Information Technology, e-Business and Applications (CSITeA04) , Cairo, Egypt, 2004, 27-29.

[8]Boaz J S.Fast correspondence-based system for shape retrieval[J].Pattern Recognition Lett, 2004, 25:217-225.

[9]BELONGIE S, MALIK J, PUZICHA J.Shape matching and objectrecognition using shape contexts[J].IEEE Transactions on Pat-tern Analysis and Machine Intelligence, 2002, 24 (4) :509-522.

利用频数分布直方图解决实际问题篇9

例1 八（2）班某一次数学测验成绩如下（单位：分）： 63，84，91，53，69，81，61，69，91，78，75，81，80，67，76，81，79，94，61，69，89，70，70，87，81，86，90，88，85，67，71，82，87，75，87，95，53，65，74，77.

数学老师按10分的组距分段，统计每个分数段出现的频数，填入频数分布表，并绘制频数分布直方图如图1.

（1）请把频数分布表及频数分布直方图补充完整．

（2）请说明哪个分数段的学生最多，哪个分数段的学生最少.

（3）请你帮老师统计一下这次数学测验的及格率（60分及以上为及格）及优秀率（90分及以上为优秀）.

解析：这是学生身边的生活情景，由频数与频率的关系可直接解答.

（1）频数分布表中69．5～79．5分数段的频数是10，89．5～99．5分数段的频率为0．125．补充频数分布直方图如图2．

（2）由频数分布表或直方图易知79．5～89．5分数段的学生最多，49．5～59．5分数段的学生最少.

（3）及格率：×100％＝95％；优秀率：×100％＝12．5％.

例2 某数学老师将本班学生的身高数据（均为整数厘米）交给甲、乙两位同学，要求他们各自独立地绘制一幅频数分布直方图.甲绘制的图如图3所示，乙绘制的图如图4所示.经检查确认，甲绘制的直方图是正确的，乙在整理数据与绘图过程中均有个别错误.

（1）问：该班有多少学生？

（2）某同学身高为164 cm．他说：“我们班上比我高的人不超过．”他的说法正确吗？

（3）请指出乙在整理数据或绘图过程中所存在的一个错误.

解析：（1）由频数分布直方图可知，全班共有5＋10＋15＋20＋10＝60（人）．

（2）他的说法正确．理由：观察图3知身高超过164 cm的只有15人，于是有＝，因此，他的说法是正确的.

（3）此题答案不唯一，如：在整理数据时，漏了一个数据，总人数少1人；或所绘制的图中，153．5～157．5和161．5～165．5这两个小组所对应的矩形高度不正确.

直方图算法篇10

1 二维直方图均衡化算法

1.1 二维直方图均衡化算法的理论依据

根据等式 (11) 找使式子达到最小的i, 就可以将输入图像X的各个灰度级映射到相应的灰度级上, 从而产生对比度增强后的输出图像Y。

1.2 二维直方图均衡化算法的具体步骤

二维直方图均衡化算法不只是对独立的像素进行处理, 而是利用了像素周围所包含的上下文信息, 具体实现流程如下:

第一步, 输入图像X, 并计算其灰度直方图。

第四步, 利用单映射规则确定映射函数关系得出增强后的输出图像Y。

1.3 彩色图像的增强

若要将灰度图像的增强算法应用到彩色图像上, 有一种方法就是仅对彩色图像的亮度分量进行处理, 而保持图像的色彩分量不变。本算法采用这种方法, 将RGB图像转换到CIE L*a*b*色彩空间, 然后只对亮度分量L*进行处理, 最后再进行一个转换的逆过程, 将CIE L*a*b*色彩空间的图像转换成RGB图像进行输出, 这样就得到增强后的彩色图像。

2 实验结果与分析

2.1 窗口大小对二维直方图的影响

二维直方图均衡化算法中唯一需要输入的变量参数w, 可以用来选取不同的w×w邻域大小来获得不同二维直方图, 从而达到不同的增强效果。下面我们选取w=1, 3, 5, 7, 9, 11, 13分别根据等式 (4) 求出归一化后的二维直方图hx (m, n) 进行比较:

从图1可以看出, 输入图像含较亮的区域比较多, 因此在高灰度级处二维直方图取值比较高。仔细观察二维直方图, 可以发现在对角线处有较高的值, 这是因为图像中同质区域的存在, 即每个像素的邻域内大多都有着相同或者接近的灰度级存在, 这就导致在二维直方图的对角线或者接近对角线的区域有高峰存在。观察图1-b至1-h, 可以发现随着邻域大小不断增大, 越多的上下文信息被利用到, 在二维直方图hx (m, n) 中主对角线的附近高峰也被减弱, 而xm与xn有较大差的区域则被得到增强。

2.2 不同窗口大小的增强图像效果

下面我们选取不同取值的w对图像进行处理再进行一系列比较:

其中图2展示了w在不同的取值下的图像增强效果。图3展示了选取不同的w值的情况下的输入图像灰度级与输出图像灰度级的映射关系。图4展示了图像在选取不同的w进行增强后输出图像的灰度直方图。从图2~4可以看出随着w的不断增大, 更多的上下文信息被利用到, 二维直方图均衡化算法在保持图像中物体高对比度的同时提升了图像的亮度。

2.3 二维直方图均衡化算法与直方图均衡化算法的关系

当只w取值为1的时候, 算法利用像素的邻域为1×1, 即一个孤立的像素而不利用上下文信息, 这时候的二维直方图均衡化算法就会退化成为传统的直方图均衡化算法。下面选取两组图片分别进行二维直方图均衡化算法w=1时与传统的直方图均衡化算法进行增强对比, 结果如下:

从图5可以看出当w取值为1的时候, 二维直方图均衡化算法就会退化成为传统的直方图均衡化算法, 对原图像有一定的增强作用, 但同时也可能会引入了一些噪声和光晕。再对比图2可以发现, 当w>1时二维直方图均衡化算法的增强效果才可以充分体现出来。

2.4 几种直方图均衡化算法效果的对比

对于各个算法, 在图像增强的过程中不可避免的都会产生不同程度和类型的失真, 所以对输出图像进行一系列对比很有必要。一般来讲, 对于一幅图像质量的好坏的评价方法可以分为两种:主观评价和客观评价。主观评价是根据观察者的主观感受, 对图像按照视觉效果做出评价。客观评价是建立数学模型并经过计算, 通过给出的量化参数或指标来衡量图像的好坏。而对于各算法运算的复杂程度即运行所需时间的长短也是评判一种算法优劣的标准。

2.4.1 视觉效果

从图6-b可以看出经过直方图均衡化算法处理后原图像偏暗的缺陷得到改善, 动态范围得到扩大, 图像整体的亮度得到了不错的提升, 但花蕊显得有些苍白, 且在阴影区域产生一了些噪声。经过局部直方图均衡化算法处理后图6-c虽然对比度得到很好的提高, 花蕊的纹理显得十分突出, 但随之出现大量的噪声, 整个图像失真严重。而经过二维直方图均衡化算法处理过后的图6-d整体的亮度得到提升的同时并未出现噪声与图像的失真, 相较于传统的直方图均衡化算法花蕊处的细节特征更加突出, 层次感丰富, 视觉效果更好。

图7-b可以看出经直方图均衡化处理后的图像沙地上的纹理细节变得较为明显, 但飞机机身偏暗, 飞机上的细节不能看见。图7-c地上的纹理细节最为明显, 连飞机影子阴影区域的细节也可见, 飞机上的细节也都十分清楚, 但沙地显得太具颗粒感。图7-d在保护图像细节的同时提升了图像整体的对比度, 飞机与沙地上的纹理都可以看见。

2.4.2 客观评价

下面对于图6~7的对比度、亮度和方差这三个方面对图像进行比较, 结果见表1~3。其中对比度指的是一幅图像中明暗区域最亮的白和最暗的黑之间不同亮度层级的测量, 即指一幅图像灰度反差的大小, 对比度越大代表差异范围越大, 对比度越小代表差异范围越小。图像的亮度则是指图像的明暗程度。方差指偏离均值的程度, 图像的方差越大, 灰度分布的范围越广, 图像中所包含的信息越多。

对比三种算法的实验结果可以看出, 二维直方图均衡化算法在几项数据对比中基本处于次好, 而局部直方图均衡化算法在数据对比中基本处于最好。

2.4.3 运算时间

对比几种算法的运算复杂程度, 从表4可以看见直方图均衡化算法作为一种最基础的图像增强算法, 计算量也是最小的, 其耗时是最少的。局部直方图均衡化算法计算量会随着窗口大小增大而增大, 即使是很小的窗口计算量也很大, 是几种算法中耗时最久的。二维直方图均衡化算法的耗时比直方图均衡化算法多一点, 比局部直方图均衡化算法少很多。

经过几组图像的对比分析, 可以看出二维直方图均衡化算法在增强视觉效果方面优于传统的直方图均衡化算法及局部直方图均衡化算法, 解决了传统直方图均衡化算法在处理一些偏亮图像时造成的局部过于偏暗的现象, 又不至于局部直方图均衡化算法在过度强调图像中细节轮廓的同时引入大量噪声, 使图像失真严重, 很难看出图像所想要表达的事物。在客观分析上数据虽然不是最好的, 但图像的信宿始终是人眼, 且数据在可接受的范围之内。由于二维直方图均衡化算法只需要很少的数学符号在短时间内就可以完成图像的增强, 是一种高效的图像增强算法。综合来看, 二维直方图均衡化算法在处理灰度图像方面效果良好, 不仅能够在增强图像的同时保护图像中的一些细节, 还能快速地完成对图像的处理。

2.5 彩色图像效果

从图8的对比中可以看出, 原图两只大象头部皮肤有一定的纹理但左边一只大象额头部位的纹理并不突出, 经过增强该区域的纹理能够较为轻松的观察得到, 而原先有纹理的象鼻与象腿则变得更加明显。

图9-a为一幅偏暗的原始图像, 经过增强以后, 提升了图像的整体亮度和对比度, 使得图中树皮的大部分细节能够很容易观察得到, 还使原图树叶上一些不容易看到的叶脉也能够较为容易地看到。

对比图10-a、10-b可以发现, 增强后图像中屋顶上的纹理更加突出, 房屋的窗框更加明显, 草地上泥土石块更清楚, 汽车内部的情况也能更加清晰地看到。但增强后的图像明显变暗, 图中的树叶呈现出一种较黑的颜色, 汽车下半部分也由于变黑变得不容易辨认。

3 结语

数字图像增强是数字图像处理的一个重要组成部分, 是图像处理的基础工作, 更是专家和学者的研究热点。本文选取利用像素上下文信息所构建二维直方图的模型, 提出了一种基于二维直方图均衡化的图像算法。二维直方图均衡化在保护图像原有细节和不引入噪声的基础上改善了图像的对比度, 使原来看不见或不容易看见的细节更加清晰, 改善了图像的视觉效果, 使图像显得更加自然, 提高了图像的可读性。从而避免了传统的直方图均衡化在增强整体对比度的同时造成局部偏暗丢失细节的问题, 以及局部直方图均衡化在增强过程中引入大量噪声的问题。同时通过实验, 说明本算法效率高, 运算量较小, 在较短时间内即可完成图像的增强, 很适合实时的图像增强应用。本算法操作也比较简单, 仅需要一个参数来调节窗口大小即可完成图像的增强。当像素周围的上下文信息, 即窗口大小为1时, 本算法就退化成为传统的直方图均衡化算法。故本算法是一种简单, 而又行之有效的算法。

参考文献

[1]Milan Sonka, Vaclav Hlavac, Roger Boyle.图像处理分析与机器视觉[M].北京:人民邮电出版社, 2003.

[2]章毓晋.图像工程:图像处理[M].北京:清华大学出版社, 2006.

[3]Gonzales R C, Woods R E.Digital Image Processing, Second edition[J].Upper Saddle River, 2002 (5) .

【直方图算法】推荐阅读：

直方图均衡07-22

直方图法08-16

直方图增强08-28

梯度方向直方图特征论文06-28

扩展算法07-16

蝶形算法07-18

区间算法07-18