肤色分割

2025-01-31

肤色分割(共3篇)

肤色分割 篇1

人脸检测是基于视觉的智能人机交互系统实现的关键步骤,是后续完成人脸识别、表情识别的基础。人脸检测[1]是指任意给定一幅图像或者一组图像序列,判定该图像或图像序列中是否存在人脸,如果存在,则确定其位置和空间分布。目前,国际国内已经涌现出了众多的人脸检测算法,其中,Paul Viola和Michael Jones[2]于2001年提出的基于AdaBoost算法的人脸检测方法,对于受光照影响和复杂背景的人脸图像检测率不高,但却是机器学习的典型算法。

随着近年来图像采集设备的改进,采集得到的图像几乎都是彩色的,因此针对彩色图像的人脸检测具有重要意义。作为彩色图像中最重要、最明显的特征,肤色受光照、姿势、表情等变化的影响较小,使用肤色信息可以大幅度减少搜索空间,降低检测难度,提高运算性能,近年来在人脸检测算法中得到越来越广泛的应用。

基于肤色的人脸检测具有检测速度快、检测率高但同时误检率也高的特点;基于AdaBoost的人脸检测具有训练费时、检测率高和误检率低的特点。鉴于此,本文提出了一种肤色分割和AdaBoost算法相结合的人脸检测方法。本文的肤色检测法可以适应不同的光照变化;改进的AdaBoost算法可以抑制分类器的退化现象;多窗口策略可以检测出大小不一的人脸。实验表明本文方法可以保证人脸检测有快速性的同时还有高的检测率、低的误检率和低的漏检率。

1 肤色检测

1.1 肤色模型

尽管肤色因人而异,但很多研究都表明:肤色在色彩空间的一定范围内还是呈现内聚性的,特别是在排除了光照影响的色彩空间里。邢果[3]等的研究表明:肤色在YCbCr空间的Cb、Cr分量上具有很强的内聚性,二者虽有少许重叠,但它们的峰值却不在同一坐标处,因而可以通过一定阈值来划分肤色和非肤色区域。本文选择在YCbCr彩色空间进行研究。

1.2 自适应光线补偿

肤色信息易受光照的影响,会对检测结果带来误差。光线补偿法可以解决这一问题。常用的光线补偿法有“参考白[4]”、“参考黑[5]”和直方图法。

本文采用一种自适应的光线补偿算法。设转换到YCbCr空间的图像的亮度值为f(x,y),灰度值rk出现的概率为p(rk),概率分布函数为sk=i=1kp(ri)。若sk<0.05及sk+1>0.05,则令这些像素的亮度值为B;若sk<0.97及sk+1>0.97,则令这些像素的亮度值为E;对于中间的像素采用对数变换,其变换公式为g(x,y)=(G-S)/(InN-InM)[Inf(x,y)-InM]+S。其中:g(x,y)表示变换后图像像素的亮度值;MN表示变换前图像的最大最小灰度;GS表示变换后图像的最大最小灰度。故经过本文的自适应光线补偿后像素的亮度值

g(x,y)={0f(x,y)<B255[Ιnf(x,y)-ΙnB]/[ΙnE-ΙnB]Bf(x,y)E255f(x,y)>E

1.3 肤色分割

在YCbCr空间,若满足Cb∈[77,127], Cr∈[133,173][6]则认为是肤色区域。

接下来进行以下工作:

(1)把肤色区域二值化为白色,非肤色区域二值化为黑色;

(2)运用形态学运算,去除二值化图像中孤立的点、填充空洞;

(3)利用肤色区域的面积、长宽比、密集度等条件进行筛选,标记出可能的人脸区域。

2 AdaBoost算法

AdaBoost[2]是一种自适应的Boosting算法,其核心思想是当分类器对样本正确分类时,则减小其权值;当错误分类时,则增加其权值,让机器在后续的训练中集中学习分类较困难的样本,最后得到一个识别率较高的分类器。

2.1 传统的AdaBoost算法

AdaBoost算法用于人脸检测时,首先抽取Haar-like[7]特征,并将其转化为对应的分类器。算法描述如下:

设有N个样本:{(x1,y1),(x2,y2),...,(xN,yN)},其中m个正样本,l=N-m个负样本,且

训练过程如下:

(a)权值初始化 记第t次迭代时第i个样本对应的权值为wt,i,初始情况(t=1)时: 正样本w1,i=1/2m,负样本w1,i=1/2l

(b)循环迭代出最佳的弱分类器(设需要提取T个弱分类器,即t=1,2,…,T)

1)归一化权值 wt,i=wt,i/∑1Νwt,j

2)对每一个特征h,训练分类。ft(x)∈{-1,+1},计算第t次迭代过程中该弱分类器对应所有样本的训练误差之和εh=iwi|ft(xi)-yi|

3)选择对应最小训练误差的分类器作为最佳分类器。即εt=min{εh}所对应的ft(x)。

4)基于得到的最佳弱分类器,对每个样本的权值进行更新:wt+1,i=εt1-εtwt,iβt1-ρi其中

βt=εt1-εtρi={1xiwasmisclassified0xiwasclassifiedcorrectly

(c)最终获得强分类器

其中at=lg1βi

AdaBoost算法的优点是权值更新规则:每经过一轮训练,算法会集中精力去学习难分类的样本,试图去正确分类这些样本;但它同时也是一个缺点,即每经过一轮训练,算法都将为误分的样本赋予更大的权值。若多次分类错误,则误分的样本的权值可能会急剧增加,从而导致样本权值出现扭曲,即所谓的“退化现象”,该现象会导致分类器的分类能力降弱。图1所示为退化曲线图。

2.2 改进的AdaBoost算法

针对AdaBoost训练过程中出现的“退化现象”,本文提出了一种改进算法。此算法通过定义一个阈值,结合样本是否被错误分类以及当前权值是否大于阈值来决定样本更新权值。权值更新公式为:

wt+1,i={wt,iβt/ztifht(xi)=yiwt,iβt-1/ztifht(xi)yi&&wt,iΗtwt,i/ztifht(xi)yi&&wt,i>Ηt

其中:βt=εt1-εt,zt是使i=1nwt,j=1的单位化因子,Ηt=i=1nwt,i/n为当前权值。训练过程同传统的AdaBoost算法,此处省略。

分析权值更新公式,由于εt<0.5,故βt<1,βt-1>1。当某样本被正确分类时,此样本的权值减小;当某样本被错误分类并且当前权值小于设定的阈值时,此样本的权值增大;当某样本被错误分类并且当前权值大于设定的阈值时,此样本的权值不变。故改进的权值更新公式可抑制被误分样本的权值过分增大,从未在一定程度上避免了分类器的“退化现象”。图2为权值更新前后分类器数目与检测率关系图。

3 多窗口策略

在用分类器窗口进行人脸检测时会遇到人脸大小不一的情况,如用长焦距拍摄的照片中的人脸偏小而在证件照中的人脸很大,同时图一幅图片中人所在位置的远近不一也使得人脸大小各不相同,这就要求分类器的窗口可以按情况适当进行调整,以满足尺寸不一的人脸检测。本文采用一种多窗口策略,即让待检测图像的大小不变,检测窗口按比例逐层放大。且窗口放大系数选为1.2。采用此方法检测证件照的结果如图3所示。

由图3可以看出:在采用多窗口的人脸检测方法后,同一张人脸会被重复检测出来,此时需要采用某种方法对检测出来的人脸区域进行合并筛选。具体做法为:设某一个窗口的中心坐标为(x0,y0),计算落在(x-x0)2+(y-y0)2≤R2圆内的窗口的个数N,若NR满足一定的条件,则认为检测到的是人脸;否则抛弃。经过多次试验,最终选定R<4和N>5作为检测结果是否是人脸的判别条件。对于判别为人脸的区域采用窗口求平均值法进行合并,即求出N个窗口的顶点坐标,再取其均值作为合并后窗口的顶点坐标,最后输出合并后的检测窗口。图4为窗口合并后的检测结果,图5为运用多窗口策略的检测结果。

由图4和图5可以看出:该策略不但可以检测单人脸图像,而且对于检测同一幅图像中大小不一的人脸具有重大突破。

4 算法描述及实验结果分析

本文首先利用肤色的聚类特性,在YCbCr空间,对图像的亮度信息进行光线补偿,接着应用肤色模型、二值化、形态学、几何特征约束等信息分割出可能的人脸区域,然后把分割出的人脸域送入由改进的AdaBoost算法和多尺度策略训练好的分类器中进行再次识别分类,进而精确定位出最终的人脸。

对本文算法进行仿真实验。实验环境为P4 CPU,2.66 GHz, Windows XP,在Matlab7.0平台上编程实现。共进行三组对比试验。试验分别采用本文算法与同类典型算法、最新算法进行对比,实验图片来自数码相机拍摄和FERET彩色人脸库,统计结果如表1—表3所示。

由表1—表3可以看出:当单独使用肤色分割、AdaBoost算法时,检测效果要好于同类典型算法;当采用肤色分割+改进的AdaBoost算法时,检测效果也好于最新论文算法的检测效果。实验的部分示例如图6所示。

由图6可以看出:本文算法既可以检测单人脸图片、又可以检测出复杂背景下的多人脸图片;同时,对于尺寸不一的多人脸图片,经采用多窗口策略后同样具有很好的检测效果。

5 结论

本文提出了一种基于肤色分割和改进的AdaBoost算法相结合的人脸检测方法。通过先进行肤色分割,去除绝大多数背景,分割出数据量小很多的可能人脸域,接着把这些可能的人脸域送入由改进的AdaBoost算法训练好的分类器中进行再识别分类,可更高精度地检测出人脸并保证有高的速度和低的误检率和低漏检率。同时,本文提出的多窗口策略可以很好地检测出同一幅图像中大小不一的人脸,避免了漏检。实验结果表明本文方法可成功地实现人脸检测功能,具有一定的实用意义。

参考文献

[1]Yang Minghsuan,Kriegman D J.Detection faces in images:a sur-vey,IEEE Trans.Pattern Analysis and Machine Intelligence,2002;24(1):34-58

[2]Viola P,Jones M.Robustreal-time object detection.InternationalJournal of Computer Vision,2004;57(2):137-154

[3]邢果,戚文芽.彩色空间的肤色分割及其在人脸检测中的应用.视频技术与应用工程,2006:91-93

[4]Hsu Reinlien,Abdel-Mottleb M,Jain A K.Face detection in colorimages.IEEE Transactions on PAMI,2002;24(5):696-706

[5]汪更生,林家骏,刘云翔.基于色度信息及投影法的彩色图像中人脸区域分割方法.长春工程学院学报(自然科学版),2004;5(5):777-782

[6]Dijk M.Embeding information in grayscale images.Proc of the 22ndSymp Informa Theory in the Benelux.2001:147-154

[7]Pageorgiou C,Oren M,Poggio T.A general framework for object de-tection.International Conference on Computer Vision.Bombay,Indi-a.1998:555-562

[8]田敬北,李寅.基于肤色分割的连续AdaBoost人脸检测算法.广西工学院学报,2012:65-69

肤色分割 篇2

手势是人与人之间交流的一种重要方式, 它是指手和手臂的一系列动作的集合[1]。目前, 手势识别技术已经成为了计算机视觉领域的一个重要课题。其中, 基于视觉的手势识别越来越受到研发人员的关注。

一般而言, 基于视觉的手势识别算法主要包括手势分割、手势定位、手势分析和手势识别四部分。其中, 手势分割与手势定位是整个算法的关键;良好的分割和准确的定位是识别的前提和保证。为了更好的分割视频手势, 有效使用各种信息包括肤色、运动以及几何信息是这项研究的关键[2]。在文献[3]中, 采用在HSI和YCb Cr颜色空间建立肤色模型, 然后利用多种形态学及密度图等方式提取分割结果, 该方法虽然对于静态手势识别性能较高, 但无法应对类肤色区域的干扰而且实时性不够。在文献[4]中, 采用HSL颜色空间下的手势阈值分割, 利用中值滤波和数学形态学操作滤除噪音, 然后运用曲线拟合法提取手势轮廓, 由于算法复杂, 且面对复杂背景其分割性能急剧下降, 因而其实用性不强。在文献[5]中, 采用RGB和YCb Cr空间进行阈值分割, 然后利用多种形态学操作进行处理再结合单高斯背景模型对手势进行分割, 虽然文中考虑复杂背景的影响, 但应对大面积的类肤色干扰效果仍然不好而且实时性还有待提高;在文献[6]中, 为了标定肤色动态手势区域, 文中利用相邻帧间差分法与肤色模型相结合对动态手势区域进行标定, 然而, 当视频中相邻两帧运动量较小时, 该方法并不能有效的对动态手势区域进行标定, 而且其肤色模型利用的是单高斯模型, 肤色效果比不上混合高斯模型。

为了应对大量类肤色区域、肤色区域干扰, 本文提出了一种简单、鲁棒、有效的算法, 相对于现有算法, 本文提出的算法主要有两个优点:1) 鲁棒性强, 能应对大量类肤色区域的干扰;2) 算法简单, 容易实现, 在保证准确率的情况下对视频手势实时分割与定位。实验结果表明, 该方法具有良好的手势分割效果和较高的定位准确度。

1 算法原理

本节将详细描述本文所提出的算法细节, 该算法主要由三个部分构成: (1) 图像预处理; (2) 特征点提取; (3) 运动手势分割与定位。

具体算法流程:1) 获取间隔N的两帧图像——第K帧和第K+N帧, N>1;2) 对第K帧与第K+N帧图像进行分别采样;3) 利用肤色模型和手势两帧相对运动信息进行采样点筛选, 提取特征点;4) 通过特征点实现视频手势分割与定位。

1.1 图像预处理

1.1.1 定点采样

肤色是手势的重要信息, 因此常用肤色信息进行手势分割;但是研究表明最能影响肤色信息的是光照因素, 虽然不同人的肤色相差很大, 但去除亮度的色度空间中肤色具有良好的聚类性[7]。因此, 本文在HSI颜色空间中的HS空间建立混合高斯模型进行肤色分割;为了降低混合高斯模型复杂度, 首先对第K帧与第K+N帧图像进行定点采样, 然后对定点采样后的两帧图像进行肤色分割。

定点采样算法依赖于最近兴起的CS理论[8], 其基本思想是利用降采样后的图像对图像进行紧凑表示是可行的。本文通过定点采样算法获取采样点, 然后对采样点进行肤色分割。

1.1.2 颜色空间与肤色模型

在HSI颜色空间中, H表示色度信息, S是色饱和度信息, I表示强度信息[9]。从RGB颜色空间到HSI颜色空间的常用转换公式[9]如下:

肤色模型按像素级进行分类可分为阈值化模型、参数模型和非参数模型[10]。本文采取的是高斯混合参数模型, 其参数模型表示为[11]:

其中:K为高斯密度函数的个数;权值wi是每个高斯密度函数对混合高斯模型的贡献大小;ui为均值向量;Ci为协方差矩阵;x为肤色像素在HSI颜色空间中H分量和S分量的值。

1.2 筛选采样点, 提取运动手势特征点

特征点是由采样点经过肤色模型和运动信息筛选获得;其中通过肤色模型可以获取间隔N的两帧图像在肤色区域中的采样点;而利用手势的相对运动信息可以滤除间隔N的两帧图像中非运动手势区域的肤色采样点, 然后通过区域生长法消除噪音, 提取特征点, 最终通过特征点实现视频手势的分割与定位。

区域生长法是根据预先定义的生长准则把像素或子区域集合成较大区域的处理方法[9];本文通过区域生长法分别对第K帧与第K+N帧消除噪音, 提取特征点, 最后通过特征点实现视频手势的分割与定位。

2 实验对比

本文算法在MATLAB R2012b上实现并进行仿真, 仿真视频来源于数码相机拍摄, 图像分辨率640×360, 实验硬件测试平台为Windows XP环境下的AMD Athlon处理器, CPU2.1 GHz, 内存1 GB的PC机。

为了验证算法的鲁棒性与实时性, 本文利用了一些不同复杂背景下的视频对运动手势进行分割与标定。经过大量实验验证, 手势标定测试结果及效率如表1所示。本文将与文献[2]提出的高斯背景模型和文献[6]提出的运动肤色模型进行对比。对比实验所采用的视频为人脸和手臂的肤色干扰及类肤色的背景干扰。

图1~6是视频中的第2、5、11、13帧手势标定结果, 从图中可以看到高斯背景模型和运动肤色模型在肤色与类肤色背景的干扰下, 无法准确分割定位手势, 而本文提出的算法即使有大量类肤色背景干扰及静态肤色区域的干扰下, 仍能够有很好的定位手势。

3 结论

本文算法主要是利用手势的运动信息与肤色信息相结合, 通过筛选肤色采样点, 提取特征点实现视频手势的实时分割与定位;通过大量实验表明, 本文提出的算法简单、可靠、鲁棒性强、易于实现, 即使在大量类肤色区域与静态肤色区域干扰的情况下, 仍能够准确实时地对视频手势进行分割与定位。为了实现最终的视频手势识别, 希望在今后的工作中, 能改善并优化分割算法, 提高处理速度。

参考文献

[1]Rautaray S S, Agrawal A.Design of gesture recognitionsystem for dynamic user interface[A].Technology En-hanced Education (ICTEE) , 2012 IEEE InternationalConference on.IEEE[C], 2012:1-6.

[2]Hong B, Xinggui Z.Study on Hand Gesture Segmentation[A].Multimedia Technology (ICMT) , 2010 Interna-tional Conference on.IEEE[C], 2010:1-4.

[3]Ghosh D K, Ari S.Color Hand Gesture Segmentation forImages with Complex Background[A].InternationalConference on Circuits, Power and Computing Technolo-gies[C], 2013:1127-1131.

[4]Xu Y, Gu J, Tao Z, et al.Bare Hand Gesture Recogni-tion with a Single Color Camera[A].Image and SignalProcessing, 2009.CISP&apos;09.2nd International Congresson.IEEE[C], 2009:1-4.

[5]王先军, 白国振, 杨勇明.复杂背景下BP神经网络的手势识别方法[J].计算机应用与软件, 2013, 30 (3) :247-249.

[6]于华平, 艾矫燕.基于肤色动态手势区域的标定[J].计算技术与自动化, 2010, 29 (002) :86-88.

[7]Yang J, Waibel A.A real-time face tracker[A].Applications of Computer Vision, 1996.WACV&apos;96., Proceedings 3rd IEEE Workshop on.IEEE[C], 1996:142-147.

[8]Candès E J.Compressive sampling[A].Proceedings ohthe International Congress of Mathematicians:Madrid[C].2006:1433-1452.

[9]冈萨雷斯.数字图像处理[M].北京:电子工业出版社, 2007.

[10]曹昕燕, 赵继印, 李敏.基于肤色和运动检测技术的单目视觉手势分割[J].湖南大学学报:自然科学版, 2011, 38 (001) :78-83.

肤色分割 篇3

人脸检测研究是模式识别和计算机视觉领域的一个热点课题。近年来,人脸检测被应用于人脸识别系统、数字视频处理、智能视频监控等方面。在实际应用中,特别是基于嵌入式平台的监控领域,由于场景的复杂性和嵌入式处理器的处理速度,人脸的位置是不能轻易获得的,因为脸部会受到化妆品、光照、人脸姿态、遮挡等各种因素的影响。肤色是人脸的重要信息,在旋转、姿态变化、表情变化等情况下有相对的稳定性,并且不同于大多数背景物体的颜色,因此人脸检测常常选用肤色特征。本文给出了一种基于肤色分割、人脸特征提取的人脸检测方法。该方法能较好较快地检测出不同光照、不同肤色、不同姿态条件下的人脸位置。

二、算法分析

1. 色偏处理。

因为物体的颜色会随光线颜色的改变而改变,所以在不同光线环境下拍摄出来的彩色图像会出现色偏,而机器又无法像人眼一样能自动修正光线的改变,所以我们要对机器拍摄的彩色图像进行色偏处理,即白平衡处理[1]。本文采用改进的Gray World方法[2]进行色偏处理。色偏处理的具体步骤是:

色偏处理后的效果如图1。

2. 肤色概率值计算。

前人的研究表明,在色度空间,人的肤色分布有聚类特性,不同种族的肤色差异主要是由亮度引起的。肤色在YCb Cr色彩空间有较好的聚类特性,并且符合二维高斯分布特点。本文利用二维高斯概率计算公式计算图像中每个点的肤色的概率值,然后根据图像的肤色概率图初步找出人脸区域。肤色的概率值计算公式如下:

其中m和C是高斯模型的均值和协方差,x是每个像素的色度分量。

3. 形态学图像处理。

为了去掉图像中的一些噪点,本文使用形态学滤波器去掉图像中的一些离散点,具体方法有腐蚀、膨胀、高斯去噪等。

4. 肤色分割。

肤色分割的目的是更清晰地显示人脸和非人脸区域,即通过阈值将图像的肤色概率图转换为肤色判别的二值化图。在这里,阈值的选取非常关键。若像素点属于该阈值范围,则该点为肤色像素点,其值为1;否则为非肤色像素点,即值为0。

阈值的选取方法有多种,比如全局阈值、自适应阈值和最佳阈值。全局阈值是指对整幅图像都采用相同的阈值进行处理,适用于背景和前景有明显对比的图像,对光照变化的图像效果很不理想;自适应阈值是根据各图像的亮度等信息对不同的区域选择不同的阈值进行处理,实际处理时,需要按照具体问题将图像分割成多个区域分别选择阈值,或者动态的根据一定的领域范围选择每点处的阈值进行图像分割,在应用中计算速度比较慢,不适合快速检测;最佳阈值[3]是针对每幅图像,选择一个最佳分割阈值。

考虑到嵌入式平台的CPU处理速度,笔者选用最佳阈值进行肤色分割。

5. 人脸检测与定位。

进过肤色分割后,需要进行人脸区域验证。本文使用Open CV工具中提供的分类器haarcascade_frontalface_alt.xml进行最后的人脸区域检测与定位。该分类器是基于Harr-Like矩形特征采用Adaboost算法[4]训练出来的,具有检测速度快、识别率高、误检率低的特点。

三、实验结果

人脸检测阶段,用摄像头捕获的图像背景是个光照不均匀的房间。测试实验的运行环境为广州天嵌公司设计的开发板TQ2440(该平台采用32位处理器S3C2440芯片,64MB SDRAM、256MB Nand Flash、2MB Nor Flash),在该平台扩展一个基于ZC301P芯片的USB接口摄像头(CMOS感光元件)。测试图像是大小为640*480、24位的RGB图像。

人脸检测的过程大致如图2。

四、结束语

本文引入了一种通过高斯模型计算肤色概率值得算法进行人脸检测的方法,并对肤色分割中的阈值选取问题进行了有意义的探讨。实验结果表明该方法具有检测率高、检测速度快等优点。当然,由于人脸检测的复杂性,这种检测方法还有待进一步改进和增强。H

摘要:本文给出了一种基于肤色分割、人脸特征提取的人脸检测方法。该方法首先对彩色图像进行色偏处理,然后使用高斯模型进行肤色检测和分割,最后对获得的候选人脸进行人脸特征提取实现最终检测。在ARM9平台的实验结果表明,文章提出的方法有较快的检测速度和较高的检测正确率。

关键词:肤色检测,肤色分割,人脸检测

参考文献

[1]陶霖密,徐光佑.机器视觉中的颜色问题及应用[J].科学通报,2001:46(3).

上一篇:生态环境空间管制下一篇:社会再生产理论