RGB空间

2024-10-23

RGB空间（共7篇）

RGB空间篇1

1 引言

边缘蕴含了图像的很多讯息, 是图像很重要的特征。传统的边缘检测[1,2]方法有基于梯度的边缘检测, 而这种方法, 主要是针对灰度图, 忽略了色度信息, 容易丢失边缘。而在RGB颜色空间的边沿检测[3]则能很好用到色彩信息, 获得更丰富的边沿信息。但基于RGB彩色空间的边缘检测的阈值不好确定, 本文将引入人工蜂群算法[4]来获得阈值。

2 基于RGB空间的彩色图像边缘检测

在RGB空间中, 令 , 分别为R, G, B轴的单位向量, 则RGB空间中任意一个向量可表示为:

针对向量函数扩展梯度的概率, 定义两个向量分别为

那么,

那么的变化率最大的方向为

而沿着这个方向的变化率值为

又有tan (α) =tan (α±π) , 如果β是式 (7) 的解, 那么β±π、2也是这个式子的解, 又因为Fθ=Fθ+π, 所以F只需要对θ在[0, π]之间计算。由式 (7) 可知, 在每个点 (x, y) 处有两个正交方向, 沿着这两方向, F值获得最大。

3 人工蜂群算法

在人工蜂群 (ABC) 算法中, 蜂群被分为雇佣蜂、观察蜂和侦察蜂三类, 人工蜂群算法主要应用到寻找最优解, 本文将用它查找最佳阈值[5]。

ABC算法实现过程为:先随机生成初始花蜜源, 再以类间方差作为适应度函数计算每个花蜜源的适应度值。雇佣蜂开始邻域搜索得到新蜜源并计算其适应度值, 与旧蜜源进行比较, 选择较为优秀的蜜源。观察蜂按轮盘赌法选择蜜源并进行邻域搜索, 再计算新蜜源的适应度值, 选择适应度值较高的花蜜源位置作为本次迭代的花蜜源位置。若是通过设置的限制次数循环后, 一个蜜源依然没有变化, 那么抛弃该蜜源, 随机生成新蜜源。算法如果达到了最大循环次数, 那就停止并给出最佳解, 否则继续进行。

4 基于RGB空间和ABC算法的边缘检测

本文提取彩色图像边缘方法步骤如下:

步骤1:对图像进行预处理。

步骤2:使用sobel算子分别得到R, G, B分量垂直方向和水平方向的偏导数, 并使用第二节的方法得到θ (x, y) 和Fθ (x, y) 。

步骤3:将Fθ (x, y) 作为待求最优解的函数, 使用ABC算法搜索出最佳解t。

步骤4:使用步骤3得到的最优阈值t来提取彩色图像边缘, 当Fθ (x, y) 大于等于t时, 像素点设为1, 反之为0。

5 仿真实验

为了验证本文方法的可行性并与普通的边沿搜索方法相比, 我们在Matlab中进行仿真。

下图为使用本文方法和使用传统的sobel边缘检测方法所得的结果。

由图可知, 传统的Sobel算法获得的边缘不够完整, 丢失边缘, 而新算法获得的边缘更为准确更加完整, 且可以自动获取最佳阈值。

6 结束语

针对传统的边缘检测方法容易丢失边缘的缺点, 本文提出在RGB彩色空间中进行边缘检测, 并引入人工蜂群算法自动搜索最佳阈值。仿真结果显示新算法能获得更好更完整的图像边缘。

参考文献

[1]陈彦燕, 王元庆.常用边缘检测算法的定量比较[J].计算机工程, 2008, 34 (17) :202-204.

[2]白俊江, 洪春勇.基于Sobel的边缘检测方法[J].电脑知识与技术, 2009, 5 (21) :5847-5849.

[3]赵景秀, 王菁, 赵昭等.基于RGB空间剖分的彩色图像边缘检测[J].光电子技术, 2009, 29 (3) :171-190.

RGB空间篇2

在彩色图像中, 颜色是人类识别彩色图像的主要感知特征之一。相对于几何特征, 颜色特征非常稳定, 对于图像的平移、尺度、旋转变化都不敏感, 表现出相当强的鲁棒性。所以基于颜色的识别技术已被广泛应用于无人驾驶机车、人脸的探测识别、自动筛选果蔬或检测食品的成熟度或新鲜程度、白细胞的自动识别、图像内容检索等研究中。

目前, 基于颜色的检索方法很多, 但对于颜色分布丰富且部分背景与目标颜色相近目标的识别没有统一标准的方法。一般用RGB颜色空间或变换后的颜色空间进行直方图统计, 统计完这些直方图后, 就会有很多方法可以用来计算两个直方图之间的相似性, 但在颜色直方图分析方法中, 颜色相互干扰严重或目标物位置不确定都会导致匹配的不准确性。

在农产品采摘过程或农产品分级过程中, 经常要求识别各种单色的彩色目标, 例如, 从茂密的枝叶中识别红绿番茄、辣椒, 白色棉花, 紫色茄子等目标作物;而有些作物的颜色和枝叶的颜色非常接近, 颜色相互干扰很大或在作物分级中掺杂物位置不确定的情况下, 单色目标的识别用颜色直方图的相似性不能反映出来。本文将一种最初应用于遥感图像的处理的方法引入到图像的颜色特性分析中:平均颜色矢量分析方法。该方法针对各种待测目标所具有的不同光谱特性, 采用光谱矢量法来进行分析的[7]。

1 颜色空间的选择

颜色空间本质上是坐标系统和子空间的规范。在进行彩色图像处理时, 采用何种彩色空间是非常重要的。采用不同的颜色空间进行分割处理, 所得出的结果会有所不同。除了RGB空间, 彩色空间还有HIS、HBS、YIQ等。一般获得的彩色图像多是RGB空间的, 通常彩色图像的常规处理也是在RGB空间进行的。虽然该空间中两点的欧氏距离与颜色距离不成线性关系, 随着明度的不同, 容易产生错误的分割[9], 但其它几种颜色空间也存在着不尽人意之处。尹建军等人在RGB与HSI颜色空间下番茄图像分割的对比研究中表明:基于RGB的阈值分割方法能够实现自适应阈值处理, 能对不同自然光照强度下的生长状态为相互分离的多目标图像进行有效分割;同时, 对番茄的成熟度及品种差异也具有很好的鲁棒性, 其性能大大优于基于HSI颜色空间H色调的统计阈值分割[4]。

2 颜色矢量定义

2.1 颜色矢量特征

给定一幅m×n的彩色图像, 每个像素点 (x, y) 都是一个三维矢量:红色 (R) 、绿色 (G) 、蓝色 (B) 三矢量。记作:f (x, y) 。即图像f是一个由m×n个矢量组成的矢量场。在彩色图像中, 色调大多数是以片状区域变化的, 即一个小范围内的色调近似为不变, 且色调的动态范围较窄, 而亮度的动态范围很大, 所以, 在强侧光源下的图像亮度变化比色调变换强烈得多。因此, 本文以RGB空间色彩信息为研究对像, 颜色矢量间的统计量变化作为测度进行图像处理。

2.2 平均颜色矢量

设RGB空间, 彩色图像中第i个像素的颜色矢量为:

其中, fi表示第i个像素的颜色矢量, fRi, fGi, fBi分别表示第i个像素在R、G、B三个分量上的值, T为转置。

若给定图像或某对像是由m×n个像素组成, 则平均颜色分量值定义为:

其中m×n为图像的像素个数, Ri, Gi, Bi值分别对应第i个像素的R、G、B分量的强度。所研究图像的平均颜色矢量W是由这三个分量组成的转置:

从以上的公式定义不难看出, 平均颜色矢量反映了图像在RGB三个分量上的总体分布情况, 因此, 定义平均颜色矢量可以有效消除由于噪声而使统计结果发生偏差的情况。

3 颜色矢量分析法

步骤1假设图像中有n个已知颜色类别, 通过对各类别训练区的统计, 求得各图像样本的平均颜色矢量和标准偏差。例如, 对于第K类目标, 颜色矢量Wk可以由式 (1) -式 (4) 得到, 而三个颜色分量上的标准偏差SkR, SkG, SkB由式 (6) 计算。

其中n为第k类目标训练区所具有的像素数, xi为第i个像素在R、G、B方向上分量值。, 是在R、G、B方向上的平均颜色值, 即

步骤2依次计算待测图像上每个像素在RGB方向上的值与各类训练区的平均颜色矢量的欧几里德距离:

其中Dk (Xi, Wk) 表示第i个像素距离第K类颜色目标之间的欧几里得距离。

步骤3计算出第i个像素和所有类别的欧几里得距离后, 选择其中最小值。这说明第i个像素和第k类目标在颜色上最相似, 像素i应归于第k类目标。

步骤4由最大类间方差计算得门限值T。

步骤5由于图像分类过程并非所有类别都参加判别, 因此, 还需要对距离函数进行检验, 检验最小的欧氏距离与该点和颜色分量的标准偏差Sk之差的绝对值是否小于给定的门限值T:

如果成立, 则判定xi属于第K类, 否则, 不能归入第k类。

4 实验结果及分析

现以石河子田间采集到的番茄图像为例, 在Matlab 7.5下进行RGB空间平均颜色矢量法实验。

4.1 各颜色分量平均值和标准差的计算

首先进行训练区的划分, 采集的番茄图像如图1所示, 其中有红色番茄, 绿色番茄, 背景。把三类目标的一块样板颜色图像作为训练区, 编号依次为1, 2, 3, 求得它们对应的R、G、B平均分量值和标准偏差, 如表1所示。

4.2 平均颜色矢量方法识别结果

得到三分量的平均值及标准差后, 对图像中的各个像素点依次使用公式 (7) 计算三类目标的欧氏距离, 然后通过比较, 将它归入欧氏距离最小的类别中。这样, 就可以得到识别后的红色目标图像和绿色目标图像。图2为被识别的红色目标图像;图3是被识别的绿色目标图像。

4.3 Canny算子边缘检测

显然在绿色目标图像上, 我们会发现番茄和枝叶颜色非常相近, 绿色番茄不能被分割出来。本实验利用Canny算子对图像进行边缘检测。Canny算子的梯度是用高斯滤波器的导数计算的, 寻找图像梯度的局部极大值。Canny算子使用两个阈值来分别检测强边和弱边, 此检测法不易受噪声干扰。Canny算子边缘检测图如图4所示。对检测出绿色番茄区域进行填充。至此成功分割出绿色番茄如图5所示。

5 结语

电法多属性RGB色彩融合篇3

1 属性融合技术

1.1 方法思路

为了模拟岩矿石的副电阻率的性态, 人们提出过很多个电路模型, 其中最成功的柯尔-柯尔模型。

其中ρ0为零频率时的等效电阻率, τ是时间常数, η是视极化率, c为频率相关系数。成千上万的岩石标本和露头上的测定结果表明柯尔-柯尔表达式不只是合适的, 而且是量度频谱激电特性的极好表达式。

四个柯尔-柯尔参数中, η表征了激电效应的强弱, ρ0反映了导电性的好坏, τ和c决定了双对数坐标中复电阻率幅频曲线变化的快慢, 和最大斜率出现的频率 (或相频曲线的陡缓和最大相位出现的频率) (频率域) 或二次场衰减的快慢 (时间域) 。根据研究, 对岩矿石的η和τ影响最大的是结构, 包括导电矿物的连通情况及颗粒大小等。c则反映了结构的均匀程度。因此, 可以根据η和τ来评价激电异常, 其中τ是评价激电异常的最重要的参数。这里选择视极化率、时间常数、频率相关系数三个电法属性进行RGB融合, 每个属性映射为一种颜色。通过改变属性与RGB的组合, 可以获得多张RGB融合图。

1.2 电法属性RGB颜色融合原理

红 (R) 、绿 (G) 、蓝 (B) 各占一个色彩通道, 作为三种基本颜色, 他们的取值范围为0~255。计算机显示设备通过RGB三者混合产生更多的颜色, 即

式中IRGB表示某一点的颜色;IR, IG和IB分别表示红, 绿, 蓝三种颜色;S为混色变换, 由计算机显示设备完成。在本文中, 由属性到RGB的映射采用的是一阶线性变换, 即

式中I表是一种属性 (η、τ、c) , νi表示一种属性的某个值, νmax和νmin分别表示一种属性值中的最大值和最小值。

1.3 电法属性RGB颜色融合流程图

2 实际电法数据处理

针对某地区数据, 首先进行插值处理, 分别得到时间常数、视极化率、频率相关系数3个 (*.grd) 文件, 利用自己开发的软件同时将这3个属性数据导入, 成图如下:

通过鼠标右键选择不同的属性组合得到不同的融合图像。

3 结论

以VC++为开发工具较好的实现了电法多属性RGB色彩融合, 明显的突出了异常, 同时验证了算法的可行性和软件的正确性。

摘要：为了提高电法属性的分析效率, 避免单一属性方法的片面性和更好的突出异常, 本文介绍在VC++环境下实现电法多属性RGB色彩融合。

关键词：多属性分析,RGB色彩融合,VC++

参考文献

[1]丁峰, 年永吉, 王志国, 等.地震多属性RGB颜色融合技术的应用研究[J].石油物探, 2010, 5.

[2]赵虎, 尹成, 朱仕军.多属性融合技术研究[J].勘探地球物理进展, 2009, 4.

[3]林岚, 李利军.基于RGB融合与主分量分析法融合比较[J].科学技术与工程, 2002, 7.

[4]刘国兴.电法勘探原理与方法[M].北京:地质出版社, 2005.

RGB空间篇4

新疆气候干燥,降雨量少 ,且昼夜温差大,日照时间长,为生产高品质的番茄产品提供了有利的自然条件。新疆番茄酱产业加工出口量占全国总产量的80%,年加工能力达80万t,成为亚洲地区最大的番茄生产加工和出口基地。继美国和意大利之后,中国成为世界第三大番茄制品生产国。目前,番茄生产主要依靠人工进行番茄分选,以剔除非成熟番茄(青番茄)。这种分选方法不仅效率低,而且人为因素较大,不利于控制番茄的品质,同时如果在番茄收获机这种高速机械上直接筛选非成熟番茄(青番茄),将不是人力所能完成的。利用光电色选机对番茄进行分选是今后发展的必然趋势。作为色选机的工作基础之一就是色值的标定,基于这种目的,对成熟番茄三原色的阈值进行了分析和研究。

1 番茄颜色RGB三原色分量阈值的确定

色度学理论认为,任何颜色都可由红(R)、绿(G)、蓝(B)3种基本颜色按不同的比例混合得到,因此RGB被称为三原色。在本文的研究中,主要考虑平面图像,平面上每一点仅包括两个坐标值,函数表达式为

f(x,y)={fred(x,y),fgreen(x,y),fblue(x,y)}

式中 x—物料在成像平面的行坐标;y—物料在成像平面的列坐标;

fred(x,y)—成像平面上一点的红色值;

fgreen(x,y)—成像平面上一点的绿色值;

fblue(x,y)—成像平面上一点的蓝色值。

在计算机图像显示系统中,物体图像的颜色也是基于RGB模型,每个像素都是由RGB三原色组合而成。基于这个性质,RGB法分选番茄是通过对番茄进行摄像,并将图像输入计算机,经过程序处理后对成熟番茄进行识别。

通过实验,应用Matlab编程对成熟番茄R分量的阈值进行分析。首先,对图像进行直方图增强;然后,用循环方法确定R分量阈值的最佳范围,并通过对比实验证实这种方法确实可以识别出红番茄。其流程可以简单表示如图1所示。

1.1 番茄及其图像的取得

随机选取成熟番茄,并混入一定量的绿葡萄和紫葡萄作为杂物,用数码相机(300万像素)对番茄在不同光线下进行摄像。图2(a)所示为曝光量不足的图像,图2(b)所示为混入杂物的图像。

1.2 番茄R分量的标定

Matlab不仅有强大的数学计算功能,而且有强大的图像处理函数和图像输出函数,其算法以m文件的方式公开。工作前期,可以通过试验对成熟番茄的RGB三原色进行标定。由于图像在采集过程中存在着种种问题,应用自然光照明时,早晨、中午或下午等时间段的光线不同。采用光源照明时,不同光源导致图像的曝光可能存在3种情况,即曝光不足、曝光过度和曝光基带过窄。因此,需要对曝光情况进行处理,以便保证对番茄的标定可以在最大程度上识别出红色番茄和杂物。首先,对R分量的阈值进行标定,处理过程如图3和图4所示。

(a) 曝光不足的番茄图像 (b) 混入杂物的图像

希望得到的只是红番茄RGB分量阈值的分布,由于背景的干扰,有可能不能得到真正的阈值。因此,采用一定的算法在保证番茄外形的前提下,去除不相关背景和杂质的干扰,其结果如图5和图6所示。

通过对图3和图4的对比发现:如果对图像进行一次直方图增强处理,处理后的两幅图像的亮度比较接近,番茄的R分量将会有更多的部分接近于1,这样给定一个较小的阈值就可以把红番茄识别出来,同时也可以避免把一些杂物误判为红番茄。通过在Matlab编程分析发现:对R分量的高通滤波值只要取一个合理的分量,就可以在最大限度内保证红番茄的外形。

用类似的方法对红番茄进行G和B分量的标定。通过对比图7和图8后发现:希望得到的只是红番茄绿色的分布,但由于背景的干扰,不能得到真正的绿色的域值,这里应用一定的算法在保证番茄外形的前提下,去除不相关的背景。通过Matlab编程分析得到了不同区间情况下G和B分量的滤波图,通过对比,选择可以最大程度保证番茄外形的一个区间作为G和B分量的域值。

1.3 红番茄含有杂物的图像识别

为了验证选定的阈值,可以在含有杂物的物料中识别出红番茄,把红番茄混入紫色葡萄和黄色葡萄中。首先,对图片进行直方图增强;然后,用RGB分量阈值进行滤波;最后,用Matlab通过一定的算法编程对红番茄进行识别,结果如图9所示。由图9可知,应用此方法可以方便地将番茄识别出来。

(a) 含有杂物的图像 (b) 处理后的图像

2 结论与讨论

1) 基于RGB法的颜色分选法是一种简单可行的方法,其关键问题就是要准确把握分选物料颜色的信息。Matlab是一种基于矩阵的数学计算工具,包含大量的图像处理和输出函数,可以快速对物料的RGB分量进行分析,从而确定RGB的阈值,为物料的分选奠定良好的基础。

2) 在番茄的色选过程中,由于物料之间的颜色对比相差较大,在不带光源的情况下,对图像直接进行直方图增强处理,可以得到令人满意的结果。通过对光线强弱不同图像进行不同范围滤波后的两种分析结果可以看出:增加光源可以使成像更加均匀,可以更大程度地减少阈值范围,从而减少物料分选过程中的误判。

3) 应用此方法,可以对三基色的其他颜色的物料进行色选。

摘要：对成熟番茄进行识别是提高番茄深加工品质的保证,也是番茄收获机械中色选部分的核心。为此,如何准确地确定物料RGB三原色的阈值是非常重要的。Matlab是一款著名的数学处理软件,拥有大量的图像处理及输出函数,可以通过程序控制来快速确定指定物料RGB阈值的最佳范围,从而进行成熟番茄的图像识别。与传统编程方法相比,这种方法具有更为简单方便和包含信息量全面等优点。

关键词：番茄,Matlab,RGB阈值,图像识别

参考文献

[1]高成.Matlab图像处理与应用[M].北京:国防工业出版社,2007.

[2]徐飞,施晓红.MATLAB应用图像处理[M].西安:西安电子科技大学出版社,2002.

RGB空间篇5

伴随人机交互和视频监控的发展, 人体姿态估计逐渐成为计算机视觉领域的一项研究热点。在人体姿态估计领域, 现有的研究方法大致可分为基于训练学习和基于部件模型的方法, 基于训练学习的方法是以全局人体为导向进行建模或分割, 其中, Sapp用一个具有代表性的样例集合来表示姿态空间, 进行姿态估计时寻找与图像特征最为匹配的样例去表示姿态估计结果, 由于人体姿态变化复杂, 该方法在寻找匹配样例的部分算法耗时比较多。基于部件模型的方法则是将人体分为若干相互关联的部件, 利用关联部件模型表示整个人体。Gaurav Sharma针对静态图像提EPM模型, Eunji Cho在FMM模型的基础上提出聚合多种姿态理论, 两种模型针对静态图像有很好的准确度, 但在对于视频场景中的应用却有局限。Ferrari提出了基于图结构模型的人体姿态估计方法, 提高了人体姿态估计的准确率, 但计算人体表观模型仍然用时较多。此外, 还有学者从粒子的角度将姿态估计问题从二维空间聚合到三维空间, 进而实现三维人体姿态重建。

本文在Ferrari的基础上做出改进, 研究人体上半身姿态估计, 提出了一种基于彩色和深度信息的人体姿态估计方法。首先根据彩色和深度图像的相关特征, 对人体区域进行检测和预分割;其次, 提出人体深度观测模型来改善人体的表观模型;最后, 优化图结构模型并估计出人体姿态。真实图像实验结果表明本文所提方法可以实现鲁棒且可靠的人体姿态估计。

基于彩色和深度信息的人体上半身区域分割

为了减少后期人体搜索成本, 首先对前景进行预分割。本文通过加入深度图像特征, 使得在分割人体区域的同时得到不同部件间的空间结构约束。首先利用Ada Boost算法和HOG特征训练人脸和手部检测器, 将检测到的人脸和手部区域用矩形框标记在对应的深度和彩色图像中, 构成图像的ROI (Region of Interesting) 。此时深度图像记为D, F则表示候选人脸和手部序列对。最后本文提出最优区域搜索算法, 通过结合人体分布特征以及深度信息确定人体的最佳区域, 并最终提取出人的上半身轮廓。最优区域搜索算法的具体步骤如算法1所示

算法1:最优区域搜索算法

属于同一主体的脸和手在图像的位置分布上具有一定的相关性, 利用相关性特征可以排除一些非同一主体的ROI。本文提出相关性函数用来判定人脸和手的相关性, 记为C (F, H) , 表达式如下:

其中l (⋅) , d (⋅) 分别表示像素在深度图像中的位置和深度值。根据式 (1) 选出符合条件的人脸手部序列对, 我们定义最优ROI能量函数Score来确定最佳的人脸和手部ROI, 其中Score可由下式计算获得:

根据最优ROI可以计算出人体区域所在的深度距离范围[Dmin, Dmax]:

通过计算人体深度距离范围和最优的ROI区域可以分割出上半身人体区域。为了确保搜索的准确性, 本文对人体区域做相应比例扩大并归一化到标准尺寸, 记为W。最后, 本文利用Grab Cut分割算法对区域W作前景提取, 进一步去除部分背景干扰。图1为一个人体上半身分割的过程示例。

人体姿态估计

基于图结构模型的人体姿态估计

本文将人体上半身划分为6个部件:头, 躯干, 左上臂、右上臂、左下臂、右下臂。使用无向图来表示上半身结构, 不同的节点即代表不同的身体部件。每个节点用矩形框表示, 记为l= (x, y, d, θ) , 其中 (x, y) 表示部件的位置, d表示部件的深度值, θ表示矩形方向。对于某一幅图像I, 人体的姿态可以定义为L= (l1, l2, l3....ln) 。经过上一步的预处理, 我们分割了人体区域, 同时也获得头部和下臂的空间分布约束关系。本文将头与下臂的约束加入到图结构模型中, 重新定义文献中的人体姿态后验概率项:

其中, D表示人体结构模型, P (L/I, D) 表示上半身姿态为L的后验概率, ψ (li, lj) 表示运动学上相连的部件约束, ϕ (I/li, D) 表示在特定的位置的图像特征和表观模型上的部件i的似然程度, ζ (lhead, llowerarms) 表示头和下臂之间的空间约束, 为各项权重。

人体表观模型

与参考文献相同, 人体表观模型是根据初始表观模型和表观模型转换机制估计得到。初始表观模型则是经先验分割计算获取, 之后再由表观模型转换机制来修正初始表观模型, 最后获得不同部件i的表观模型和背景模型, 分别记为iP (c/f g) , iP (c/b g) 。根据贝叶斯公式 (5) 计算出不同像素点属于部件i的概率, 用来计算式 (4) 中的ϕ (I/li, D) :

改进的人体表观模型转换机制

为了得到更加精确的人体表观模型, 本文在文献的基础上加入人体深度观测模型。人体深度观测模型是根据检测到主体区域以及其所在的深度范围所确定的, 用DM表示。使用深度直方图模型, 将深度范围分为256份, 定义每份深度为d。在计算观测模型之前, 需要将主体区域的深度值根据深度范围进行归一化处理。改进后的人体各部件的表观模型AMtTM可以表达为:

其中, AMSP为初始的表观模型 (由先验分割获得) , AMDM为深度观测模型, wit是部件i与t的混合权重。因为建立外观模型的准则是使所有训练图像已标注的人体部位与外观模型的似然度的均值最大, 所以各子分类器的权值可用下式来估计:

其中, AMGT是文献根据标记图像训练所得到的真实观测。由下文的实验结果表明, 使用本文改进后的转换机制, 可以得到更加精确的人体表观模型。

实验

实验数据

实验使用两个不同的数据集来评估本文的算法:DGait database和本文作者实验室数据集, 下文记为A和B数据集, 其中分别在DGait database取20组人物 (1000张) 图像对, 实验室数据集取9组人物 (450张) 图像对 (图像对是指对应的彩色和深度图) , 两个数据集都是通过kinect设备采集。本文采用PCP (Percentage of Correctly estimated body Parts) 评估准则, 分别测算不同部件被正确估计的百分比。根据PCP准则定义, 如果部件估计所得位置与其真实标记区域重合度高于50%, 即认为该部件被正确估计。本文硬件环境为Intel Core i5 CPU, 4GB内存。

实验结果与分析

本文根据不同的数据集和不同方法做了对比实验, 如图2所示, (a) 是应用Ferrari方法的结果示例, (b) 是应用Wang方法的结果示例, (c) 是应用本文方法的结果示例。通过观察发现, 因为光线或者手臂活动等原因, 前景很容易受到背景干扰, 本文在增加了深度信息后, 弥补了Ferrari和Wang方法的不足, 得到了更加准确的人体姿态估计结果。表1列出了不同方法在六个部件上的定量PCP值和算法耗时, 可以看出, 本文的方法在六个部位上都取得了最高的PCP值, 平均耗时也是最少的。说明通过加入深度信息, 可以有效提高人体姿态估计的准确率, 并且减少后期人体搜索的成本。此外, 本文在生成人体表观模型时, 直接使用深度观测模型生成最终的表观模型, 得到如图3的实验结果, 从实验结果可以看出, 仅仅利用深度特征是不能提供足够的区别性的信息, 证明了彩色图像特征在人体姿态估计中的重要性。

结束语

RGB空间篇6

关键词：YCbCr,RGB,彩色空间转换,无乘法器,可配置

0 引言

YCbCr (YUV) 色彩空间和RGB色彩空间是两种不同彩色空间的表示方法。其中, YCbCr格式以其易于实现压缩, 方便传输和处理被广泛应用于广播电视系统及计算机视频、图像系统中, 如JPEG, MPEG1-2, MPEG4, H.26x等;RGB一般是显示屏幕的标准输入格式, 因此在实际应用中经常需要将YCbCr数据转换至RGB彩色空间, 以达到实际应用需求。YCbCr与RGB的色彩空间转换涉及矩阵浮点乘加运算, 如果在嵌入式系统中用软件代码实现, 将占用CPU的10%～15%的图像解码时间, 如果完全用硬件浮点乘法器实现, 将会增加芯片面积和功耗。目前主流的实现方法有:使用定点乘法器的并行实现方法[1,2,3,4]和查表式LUT实现方法[5,6,7]等。使用并行结构乘法器必然会增加硅片面积和功耗;查表式LUT方法需要较多的ROM存储单元。因此, 为了追求低成本、低功耗、实时性、通用性等要求, 在此提出一种可配置精度的YCbCr到RGB高性能视频解码电路。该电路采用加法和移位计算代替浮点乘法运算, 以减少芯片面积;采用流水线结构, 以提高数据转换频率;根据功耗、面积、转换精度等要求, 可调整加法器和流水线寄存器的位宽, 以达到各种不同应用的需求, 同时支持YUV111, YUV421, YUV411等压缩图像格式的转化, 并支持DMA数据存取操作, 加速整体YCbCr与RGB的数据转换。

1 YCbCr与RGB转换原理及快速实现方法

YCbCr与RGB格式之间的转换矩阵如式 (1) 、式 (2) 所示[8]。由式 (1) 、式 (2) 可以看出, 要实现彩色空间转换, 必须引入浮点乘加运算才可以完成数据转换。其中, YCbCr到RGB的转换有:

$\begin{array}{l} [\begin{matrix} Y \\ C_{b} \\ C_{r} \end{matrix}] = [\begin{matrix} 0.299 & 0.587 & 0.114 \\ - 0.168 7 & - 0.331 3 & 0.5 \\ 0.5 & - 0.418 7 & - 0.081 3 \end{matrix}] \cdot \\ [\begin{matrix} R \\ G \\ B \end{matrix}] + [\begin{matrix} 0 \\ 128 \\ 128 \end{matrix}] (1) \\ [\begin{matrix} R \\ G \\ B \end{matrix}] = [\begin{matrix} 1 & 0 & 1.402 \\ 1 & - 0.344 14 & - 0.714 14 \\ 1 & 1.772 & 0 \end{matrix}] \cdot [\begin{matrix} Y \\ C_{b} - 128 \\ C_{r} - 128 \end{matrix}] (2) \end{array}$

要实现7个加法, 4个浮点乘法运算。在JPEG解码过程中, IDCT解码后所形成Y, Cb, Cr数据缓冲区是16位补码表示的数据, 与其他图像标准解的数据类似。下面给出JPEG解码中关于YCbCr转RGB的实际使用的浮点转换程序:

void YUV2RGB (short *y, short *cb, short *cr, unsigned char *rgb)

{

short r, g, b, k, dlt;

char yv, yh, i, p;

dlt=0;

for (yv=0;yv<YV;yv++)

for (yh=0;yh<YH;yh++) {

for (i=0;i<64;i++) {

p= (i%8) /YH+ ( (i/8) /YV) *8+yh*4;

k=dlt+i;

r=128+y[k]+cr[p]*1.402;

r= (r&0xffffff00) (r>>24) ^0xff:r;

g=128+y[k]-cb[p]*0.34414-cr[p]*0.71414;

g= (g&0xffffff00) (g>>24) ^0xff:g;

b=128+y[k]+cb[p]*1.772;

b= (b&0xffffff00) (b>>24) ^0xff:b;

rgb[k*3+0]= (unsigned char) b;

rgb[k*3+1]= (unsigned char) g;

rgb[k*3+2]= (unsigned char) r;

}

dlt=dlt+64;

}

其中, YV, YH表示JPEG[8]中SOF字段中关于Y的采样系数, 如1×1, 1×2, 2×1, 2×2分别表示YUV111, YUV421 (垂直) , YUV421 (水平) , YUV411等压缩模式。

由于转换算法中还有浮点乘法运算, 为了在ASIC中实现简化算法, 由BINDCT[9,10]算法得到启发, 采用加法和移位运算代替浮点乘法运算。比如浮点1.402的转换可以用1+13/32=1+1/4+1/8+1/32=1.406 25代替。其中, 绝对误差由式 (3) 计算得出, 相对误差由式 (4) 计算得出。从误差 (3) , (4) 可以看出, 转换精度可以得到保证, 同时, 1个浮点乘法变为4个加法和移位计算, 大大简化了计算复杂度, 加快了运算速度, 所以该方法是实际可行, 并行之有效的方法。

error=1.406 25-1.402=0.004 25=0.425% (3)

error= (1.406 25-1.402) /1.402=0.303% (4)

表1中给出转换近似参考表达式。其中, 将转换精度设为1/32。当然还可以进一步减小精度, 以减小加法器的宽度和位数, 从而减少整体加法器的面积。使用表1中的参数, YCbCr到RGB的转换运算中需要的浮点乘法运算可以简化为加法和移位运算, 达到了使用较少的基本逻辑单元, 以实现色彩空间的转换运算, 提高了整体运行速度。根据加法器输入数据的宽度, 可以选择不同的加法器结构 (如CPA或者CLA等) , 以提高加法器效率。根据解码程序可以很方便地实现流水线架构, 从而提高整体的运算速度。

2 YCbCr到RGB转换电路实现

2.1 转换逻辑框图

因为该模块应用于JPEG[8]解压中, 根据JPEG解码过程, 得到如图1所示的VLSI逻辑框图。由于JPEG编码过程中, 采用Y, Cb, Cr 压缩编码, 所以在解码过程中, 经由IDCT反变换后, 形成如图1所示Y, Cb, Cr的3个缓冲Buffer。因为JPEG中采用了YUV111, YUV421 (垂直) , YUV421 (水平) , YUV411等压缩模式, 所以将Y缓冲区设置成为256×16 b的RAM;Cb和Cr缓冲区设置成为64×16 b的RAM。其中, 将R, G, B的缓中区设置成为LCD在SDRAM中的刷新缓冲区, 用YCbCr2RGB模块完成色彩空间转换算法。逻辑控制模块完成从YCbCr缓冲区的数据读取, 送入YCbCr2RGB模块完成数据转换, 将得到的RGB数据存入到LCD的刷新缓冲区, 此时, 从LCD上就可以看到JPEG解压后的图像数据。

2.2 YCbCr2RGB运算及PIPELINE结构

根据JPEG解码中YCbCr转RGB的实际使用的浮点转换程序1和转换近似值参考表1, 得到如图2所示的YCbCr2RGB运算框图。该算法使用14个加法器, 3个数据选择器, 就完成YCbCr到RGB色彩空间的矩阵转换, 所以该结构相对于使用定点乘法器的并行实现方法[1,2,3,4]和查表式LUT实现方法[5,6,7], 具有较少的电路面积。其中, 加法器的数据宽度在13～19位之间, 当表1的参数近似值误差选取更大一些时, 加法器位宽和个数都会减小。例如, 最小绝对误差取1/16或1/8时, 整个运算逻辑电路的面积会成比例地减少。虽然这样计算结果误差会大一些, 但是对于人眼的视觉效果来说, 感觉不到明显的区别。为了提高运算速度, 决定3级的PIPELINE, 加速数据转换速度。在实际使用时, 可以根据不同转换精度需要, 增加加法器宽度和PIPELINE寄存器宽度, 以达到不同应用的精度需求。

2.3 YCbCr2RGB的流程分析及性能提升

当JPEG数据经由霍夫曼解码和IDCT反变换存入YCbCr缓存后, 就可以进行YCbCr到RGB的数据转换。YCbCr2RGB转换一组8×8点的数据, 然后存入LCD在SDRAM中的刷新缓冲区, 整个数据转换过程需要275个系统时钟。其中, YCbCr2RGB运算只需要66个系统时钟。可以看出, 该运算的瓶颈在数据传输通道。为了更快速的计算, 该控制器实现了DMA操作方式, 可独立运算多组的数据和存储结果数据。采用DMA运算时, 将需要运算的数据首地址、运算长度和数据存储地址存入YCbCr2RGB的控制寄存器中;然后启动DMA单元, 该运算单元会自动从YCbCr缓存中读取数据进行YCbCr2RGB运算, 并将结果存入目标SDRAM中, 同时自动更新DMA相关寄存器。当DMA计算完成后, 置状态寄存器标志位, 并产生中断信号, 以供CPU查询是否完成数据转换。

3 YCbCr2RGB运算精度验证

在图像领域中, 常用的评价方法是峰值信噪比 (PSNR) :设有原始图像A={aij}∈FM×N和处理后的图像B={bij}∈FM×N, PSNR的定义为:

$Ρ S Ν R = 10 \log_{10} \frac{(255)^{2}}{\frac{1}{Μ \times Ν} \sum_{i}^{Μ} \sum_{j}^{Ν} (a_{i j} - b_{i j})^{2}} (5)$

表2为采用该电路转换后的PSNR值。可以看出, 转换后的值都在30附近, 而人眼对PSNR值大于30的图像看不出失真, 所以该电路处理后的图像符合要求。

在一个SoC系统上加载了YCbCr2RGB运算器, 测试条件为解码同样JPEG图像, 相对于运行纯软件解压算法的SoC系统, 运行YCbCr2RGB运算器的解码时间减少了10%～20%。该算法的Verilog的RTL代码, 采用Altera APEX20KE 1500EB 652器件, 经过Quarter 6.0综合后, 系统时钟可以运行到100 MHz, 并在Altera APEX20KE 1500 EB 652的FPGA实验板上通过验证。使用UMC.25工艺库综合后, YCbCr到RGB转换电路可以达到220 MHz。

4 结语

该YCbCr2RGB运算器采用加法和移位运算近似实现了浮点乘法矩阵运算, 减小了芯片整体面积, 加快了运算速度, 提高了整体性能。该方案已经应用于一款SoC芯片中的硬件MMA (多媒体加速单元) 中, 通过实际使用, 证明该YCbCr2RGB运算器可以满足JPEG的实时解码显示的要求。

参考文献

[1]刘翔, 何咏, 戎蒙恬, 等.一种集成24位YCbCr (8∶8∶8) 硬件加速的LCD控制器[J].信息技术, 2008 (1) :5-8.

[2]刘朋瑞, 郭炜, 付宇卓.基于乘法元的查表法实现的色彩空间转换[J].计算机工程, 2007, 33 (16) :251-252.

[3]张文爱, 张博, 程永强.基于FPGA的高分辨率VGA显示控制器的设计[J].现代显示, 2006 (7) :55-58.

[4]冷星星, 滕奇志, 卿粼波, 等.基于FPGA视频处理系统的颜色空间转换[J].微计算机信息, 2008, 24 (2) :219-225.

[5]周钱生, 戴麟.快速查表法优化视频解码中YCbCr到RGB的转换[J].现代电子技术, 2007, 30 (15) :167-169.

[6]唐国维, 李红, 李井辉.基于查表法的YUV视频播放器[J].大庆石油学院学报, 2005, 29 (2) :57-59.

[7]王钟明, 张盛兵, 卢国建.一种LCD显示控制器的设计与实现[J].科学技术与工程, 2006, 6 (10) :1 376-1 380.

[8]穆荣, 朱贺新, 焦继业.一种高度并行无乘法器结构的二维IDCT协处理器设计[J].微电子学与计算机, 2008, 25 (1) :104-107.

[9]Tran T D.The Bin DCT:Fast Multiplierless Approximationof the DCT[J].IEEE Signal Processing, 2000 (7) :141-145.

RGB空间篇7

1 LED封装

LED封装不同于集成电路的封装，对封装材料要求较高，它是一种发光芯片的封装。LED的封装不仅要求能够保护灯芯，而且还要能够透光。

目前常见的背光显示屏参差不齐，简单点的是采用白光LED，工艺方法是用蓝光LED芯片上激发YAG荧光粉，其所发出的黄绿光与蓝光合成白光LED；质量要求高的采用RGB全彩LED，采用红、绿、蓝多个芯片发光混色成白光, 与白光LED其彩色空间要丰富的多。对于高质量RGB显示屏，由于其由红、绿、蓝三种LED的像素点组成，任一颜色LED的失效均会影响显示屏整体视觉效果。目前，行业一般要求在LED显示屏开始装配至老化72小时出货前的失效率应低于万分之三。这就提高了LED封装厂商对RGB全彩LED光源产品稳定性能的要求。

2 RGB全彩LED封装工艺常见异常状况分析

LED的理论寿命非常高，但事实上它的使用时间远达不到理论值，因为有很多因素会影响LED的寿命，包括LED芯片、自然应力、封装技术等因素。RGB全彩LED光源的失效模式主要包括电失效（如短路、断路、漏电等）、光失效（如胶面异常引起的光学性能劣化、暗灯等）和机械失效（如引线断裂、脱焊、虚焊等），而这些因素都与封装结构和工艺有关。本文将从RGB全彩LED封装生产工艺的主要环节，对生产中常见异常引起的LED光源电、光、机械失效进行简单分析。

2.1 固晶、焊线不良引起的电失效

固晶工艺是通过在支架上点绝缘胶或银胶，把LED芯片固晶到支架的碗杯中央。在工艺中要注意，点胶量的多少直接影响LED灯珠死灯，点得多了（如图1所示），胶会返到芯片金垫上，造成短路；点得少了，芯片又粘不牢，散热变差，长时间点亮后很容易死灯，而这种隐形的不良将带来严重的损失。

焊线工艺是用导线将芯片表面电极和支架连接起来，当导通电流时，使芯片发光。在该生产过程中各参数控制很关键，金丝球焊机的压力、时间、温度、功率四个参数要配合的恰到好处。其中，打线时偏焊是最常见的问题，也是这一环节最容易引起死灯的原因，如图2所示。由于电极金球严重焊偏，漏电参数（IR>100μA）异常，严重的甚至引起死灯现象。这是由于芯片外延层非常薄，电极焊偏严重会搭界在芯片边界，造成芯片PN结短路导致漏电或死灯。

2.2 点胶不良引起的光失效

RGB全彩LED封装的点胶工艺，是将环氧树脂胶注入支架碗杯，胶面成微凹形状，经烤箱烘烤固化。主要作用是保护芯片和导线，同时提高出光率。由于封装所用的环氧树脂材料，会因为光照以及温升而引起其光透过率的劣化，在光源长时间使用中，表现出原本透明的环氧树脂材料发生褐变，或出现暗灯等。因此，在进行RGB全彩LED封装的点胶工艺中，要严格控制胶体的固化的条件，避免在封装时就已经成了环氧树脂的提前老化。

2.3 热膨胀、湿气引起的机械失效

在RGB全彩LED封装中，有不同的材料，由于各材料热膨胀系数不同，在灯珠灯珠经长时间点亮或经高温焊接后，各物质不可能回复到它们最初的接触状态，相互间存在一定应力，这个应力严重的会压坏芯片，拉断金线等，从而造成LED光源死灯或严重漏电。例如，如果点胶时，胶体硬化速度过快，胶体内应力过大，灯珠经长时间点亮或经高温焊接后，由于胶体的膨胀，会导致胶体中有裂化发生，且胶体与支架之间蓄积的拉力会拉动金线，引起死灯或严重漏电。

湿气也是影响LED寿命的重要因素。由于对LED的静电防护，LED封装生产要求恒温恒湿的环境，因此，LED封装车间备有加湿器，整个封装生产过程要求湿度在40%～60%。但是，在LED使用中，由于水汽的渗入，引起封装材料内部引线变质，或由于水汽引入的导电离子驻留在芯片表面，引起漏电，严重的甚至影响LED的光学效果，出现暗灯等现象。因此，在RGB全彩封装工艺中，要求对原材料进行防潮工艺处理，固晶前要严格对支架除湿。除此之外，对于半成品、成品材料的除湿也是非常必要的。

结语

目前，由于RGB全彩灯珠多用于显示屏、室外装饰等，在实际使用过程中，受外界环境因素影响，寿命远远不能达到所预期的理论值。为了确实提高LED的寿命，需要对LED封装制造工艺进行更进一步的研究、探索和实践。只有掌握LED失效的根本原因，并在生产实践中加强监控和质检，才能改善LED光源性能的稳定性，将RGB全彩LED光源推广到应用领域。

摘要：随着科技的发展, LED产业取得了长足的进步, 其应用领域和范围不断的扩大, 同时对LED的封装技术也提出了更高的要求。本文从RGB全彩LED光源工艺入手, 分别从固晶、焊线不良引起的电失效, 点胶不良引起的光失效, 以及由于材料热膨胀、湿气等引起的机械失效三方面, 系统的介绍了RGB全彩LED封装生产过程中经常遇到的异常。

关键词：LED封装,RGB全彩,异常

参考文献

[1]谢勇.LED封装工艺常见异常浅析[J].现代显示, 2009.

[2]陈建伟, 王海龙.SMTLED封装用固晶胶的失效分析[J].中国胶粘剂, 2009.

【RGB空间】推荐阅读：

空间教学建筑空间设计论文10-19

浅谈线性空间与欧式空间09-20

住宅空间07-15

空间符号07-15

屋顶空间07-18

空间个性07-21

空间性能10-13