仿射变换

2024-05-20

仿射变换(精选4篇)

仿射变换 篇1

摘要:基于图像的文字识别技术面临着许多的课题, 因几何形变而造成的文字误识别即是其中的一种。针对因拍摄角度不当而导致的文字变形问题, 本文提出了基于仿射不变性的文字识别技术。在本方法中, 利用仿射不变性初步对待识别文字进行辨认, 之后通过推测旋转角度对文字进行高速的文字识别。本方法具有较高的识别鲁棒性, 且识别时间短, 能够满足实时辨认的要求。仿真的结果表明, 本方法能够对产生变形的文字进行高速有效地识别。

关键词:近似圆,正规化,特征直方图,文字识别

近年来, 随着数码相机制造技术的日益成熟, 数码相机的性能大幅提高, 千万级像素的数码相机已经成为主流配置, 市场上也已出现了为手机配置的千万级像素微型数码相机。数码相机的性能除了硬件的提升, 在软件方面, 自动拼接、防抖、人脸识别等功能的实现使得用户能够轻松拍到清晰、专业的数字图像。在此背景下, 数字图像中的文字识别技术受到了广泛的关注。围绕图像中的文字识别技术, 研究人员在自然场景理解、汽车牌照识别、数字图像图书馆、地理信息系统等领域展开了相关的研究与应用[1], 也出现了诸多成熟的商用软件。

然而, 在对数字图像中的文字进行识别的过程中, 存在着许多必须解决的问题[2]。其中, 拍摄图片时由相机与文字平面存在的角度与透视关系而造成的文字变形是妨碍文字识别的主要原因。本文提出了利用仿射不变性对变形文字进行矫正, 通过比较校正后距离直方图及角度直方图与标准样本的相似度, 进而进行高速文字识别的方法。仿射不变性对沿x, y轴旋转的变形文字具有良好的矫正效果, 同时, 通过比对角度直方图的方法, 使得沿z轴方向的旋转文字也能够高速有效地识别。因此, 本文所提方法对沿各方向旋转的变形文字均能保证具有较高的正确识别率。

1 基于仿射不变性的文字识别方法

1.1 基于仿射变换的文字标准化处理。

本方法首先对产生变形的待识别文字做近似椭圆, 后将近似椭圆矫正为标准正圆。因变形文字与近似椭圆具有相同的仿射性质, 近似椭圆矫正为正圆的同时, 变形文字也矫正为标准化文字。

1.2 依据距离直方图的初步文字识别。

文字图像中到文字重心距离相等的文字像素的分布情况称为距离直方图。经仿射变换后的正圆半径为R, 设圆内bin数为n, 总bin数为k。在本方法中n与k有如下关系:

即将正圆半径R平均分成n份, 相邻两个同心圆的半径差为R/n。因标准化处理后的正圆外仍有可能存在文字像素, 故依据k的取值, 将正圆外按照半径差为R/n的规律添加1或2个同心圆。统计落在相邻两个同心圆间的文字像素个数, 即可做成该文字的距离直方图。将距离直方图的bin总数调整为1, 进而能够得到归一化的距离直方图。将归一化的距离直方图视为一个k维向量, 每个bin内的文字像素个数视为向量值, 则利用式1可计算待识别文字与标准样本文字的相似度。

其中, X为标准样本文字的直方图, Y为待识别文字的距离直方图。当计算得到的相关系数ρ>Td时, 则输出识别结果。若比对所有标准样本文字后得到的相似系数ρ均小于阈值Td时, 则依据角度直方图进行进一步的识别判断。

1.3 依据角度直方图的文字识别。

文字像素在各角度内的分布情况称角度直方图。将标准化处理后的图像按角度平均分成m份, 统计在每个扇形区域内的文字像素个数, 即可做成该文字的角度直方图。将角度直方图的bin总数调整为1, 亦可得到归一化的角度直方图。

传统的旋转文字识别方法, 需要从不同方向统计直方图, 比较与标准文字直方图的相似性后, 进而进行文字的识别。此方法每次变换方向都需要重新统计文字像素的个数, 因此必然会破坏文字识别的实时性。利用角度直方图的文字识别方法, 统计以文字重心为圆心, 向外辐射的扇形区域内的文字像素量, 因此具有旋转不变性。当与标准文字直方图进行比较时, 无需重新统计分布直方图, 只要进行移位处理即可完成旋转文字的直方图统计, 因此可有效缩短文字识别时间, 提高实时性。

同样, 计算待比较文字旋转m次与标准样本的相似度ρ, 当ρ>阈值Ta时, 输出识别结果。若比对所有标准样本文字后得到的相似系数ρ均小于阈值Ta时, 则进入综合识别判断阶段。

2 仿真实验及结果分析

本实验所用计算机的处理器为Intel CeleronⅢ, 主频为1.0GHz, 内存为512M。为模拟手机、数码相机等嵌入式设备的处理能力, 本实验特选取了配置相对较低的计算机进行模拟仿真实验。实验对象为Times New Roman字体的10个数字及52个英文大小写字母, 共计62个字符。利用仿射变换矩阵 对62个字符实施仿射变换。在此将仿射变换矩阵做如式1分解:

其中L (β) 为放大缩小变换矩阵, 参数β为放大缩小倍数。R (θ) 为旋转变换矩阵, 参数θ为旋转角度。S (φ) 为偏移变换矩阵, 参数φ为水平偏移角度。分别设置参数β、θ及φ的值, 并对62个英文字符进行仿射变换。

利用基于仿射不变性文字识别的方法, 对前述变换后的变形文字进行识别, 其正确识别率及识别时间如表1所示。由于篇幅所限, 本文并未将所有的实验结果列入表中, 只将部分有代表性的结果罗列出来。由表1可见, 在对表中所列出的22个字符所进行的识别实验中, 平均正确识别率达到了97.4%, 最高识别率为100%, 最低识别率为50.1%。对所有62个字符的实验结果而言, 90%以上的字符其正确识别率超过了98%。从文字识别所用时间上看, 本方法的文字识别时间主要分为四部分:变形文字标准化所需时间;依据距离直方图的初步识别时间;依据角度直方图的识别时间及综合识别时间。实验结果表明四部分的平均耗时分别为:30ms, 50ms, 90ms, 10ms。因此, 利用本方法进行文字识别的最短时间约为80ms, 最长时间约为180ms。与传统的识别方法相比, 在旋转文字的识别阶段最多可节约400ms的时间, 大大提高了文字识别速度, 满足了文字识别在嵌入式系统中应用的实时性需求。

3 结论

本文提出了基于仿射不变性的高速文字识别方法。仿真数据的实验结果表明除少数形近字外, 此方法对90%以上的英文及数字有100%的正确识别率。且基于角度直方图的旋转文字识别方法使得旋转文字的识别速度与传统方法相比提高了60%以上。证明了本文所提方法在文字识别领域中的有效性及其高效性。

参考文献

[1]李敏花, 柏猛.基于蚁群优化算法的复杂背景图像文字检测方法[J].计算机应用, 2011 (7) :1844.

[2]Liang J, Doermann D, Li H.Camera-based analysis of text and documents:a survey[J].IJDAR.2005, 7 (2-3) :84-104.

浅谈图像仿射变换的应用 篇2

1图像的仿射变换

图像可以看作是由成行列的像素点组成。因此可以通过建立坐标系,给每个像素点定一个坐标。仿射变换实际上就是坐标变换,即根据图像变换的原理,得到变换前后图像坐标间的映射关系。假设输入图像中,像素点的坐标是 (x,y);输出图像中,像素点的坐标是 (x1,y1)。为了表示仿射变换,需要引入齐次坐标,即用三维向量 (x,y,1) 表示二维向量(x,y),对于高维来说也是如此。按照这种方法,就可以用矩阵乘法表示变换。仿射变换可以统一表示为:

当矩阵的行列增加时,右下角的元素1不变其它部分用0填充,任何仿射变换都可以由上式变换而来。对a11-a22的不同取值,对应着不同的变换类型:

(1) 平移,将每一点移动到 (x+ax,y+by), 变换矩阵为:

(2) 旋转变换,将目标图像绕原点顺时针旋转角度, 变换矩阵为 :

(3) 剪切变换,又称“错切变换”,相当于一个横向剪切与一个纵向剪切的复合,变换矩阵为 :

(4) 缩放变换,将每一点的横左边放大 ( 缩小 ) 至a倍、 纵坐标放大 ( 缩小 ) 至b倍,变换矩阵为:

仿射变换可以看作是由平移、旋转、剪切和缩放多个操作级联而成。

2仿射变换的应用

仿射映射是实现识别的一个重要部分,以下是一些典型的应用及其实现过程。

2.1交通标志检测

基于计算机视觉的道路交通标志识别系统(TSR)是智能交通系统(ITS)的重要组成部分。将仿射变换应用于TSR,可以较好地解决场景图中交通标志的变形问题, 并通过对其进行形状校正来提高交通标志检测和识别的准确率。

以三角标志牌识别过程为例,具体步骤如下:(1) 对图片进行去噪和颜色分割的预处理;(2) 利用颜色信息分割该交通标志,确定感兴趣区域;(3) 对感兴趣区域进行二值化扫描,并找到感兴趣区域的三个端点位置;(4) 计算旋转的角度,将感兴趣区域围绕最左边的点 ( 或者图像边缘的特征点 ) 做旋转;(5) 根据仿射变换式确定仿射矩阵,将斜三角变换成为标准三角。与此类似的应用有车牌识别等。

2.2文本图像纠正

在一副图像中进行文本检测和定位,一般利用基于区域(利用文本区域独特的梯度分布、纹理和颜色)的方法。

首先,假定文本和背景有强烈的对比,因此这些高梯度值被视为文本区域良好的候选域,通常以边缘检测或图像梯度特征来定位文本域。然后,采用局域阀值处理方法二值化图片。接着,进行抽取工作,即对二值化图片中的候选域进行文本验证,输出字符。接下来的工作就由仿射变换来实现。根据文字的实际情况,计算其旋转角度并调整图像的立体倾斜。此方法最大的应用是OCR文字识别软件等。

2.3卫星图像的配准

卫星图像由于距离和精确度的限制,很难对图像的各个细节进行细致的描述,所以对卫星图像的匹配一般都是基于图像边缘信息的。首先,通过网络数据或实际测量, 建立卫星图(边缘信息)数据库作为模板。然后,对所拍的卫星图像进行快速多尺度小波变换来提取边缘信息及关键点(如交点和拐点)。接着,利用仿射变换对边缘信息图像进行校正。最后,将卫星图像与数据库中图像进行关键特征点的配准。相关应用有GPS定位、高空捕捉等。

2.4医学图像配准

对于人体的医学图像配准,主要针对刚体。所谓刚体指物体内部任意两点间的距离保持不变,如人的头部。在配准过程中 , 主要使用参数图像配准方法,即基于标记点、 主轴、灰度的配准。以基于标记点的配准为例 , 对同一个病人在同一时期不同时间进行2次大脑磁共振成像 (MRI) 检测,得到a图和b图。首先,对a图,识别并定位两个以上的标记点(一般选轮廓上曲率的极值点、灰度的极值点或拐点等)。然后,对b图进行同样的处理。接着,对b图进行仿射变换,调整其与a图配准。最后,根据配准结果就可以看出来病人的病情发展情况。与此类似,对于人体骨骼的CT、MRI、X光图都可以应用仿射变换来实现图像匹配。

2.5人脸对齐

人脸识别技术是当前生物特征识别的热点之一,在信息安全、视频监控、视频跟踪等领域有着广泛的应用前景。要完成人脸识别,一个重要的步骤就是进行人脸对齐。在对齐的过程中,首先计算出平均脸,然后将摄像头所拍到的人头像的眼睛、鼻子、嘴巴、耳朵等特征进行平移、缩放、 翻转、旋转(二维仿射变换)到平均脸的对应位置。最后,将得到的结果在人脸数据库(如CAS_PEAL、AR和UMIST等)中进行匹配。

2.6无人机目标识别

现代化作战中,无人作战飞机有很大的用武之地 , 能否正确的识别目标是考验无人机先进与否的关键。

在无人机的垂直俯冲阶段,由于目标在无人机俯视方向上可看做是二维的刚性物体。利用放射变换的仿射不变矩特征,只需对其进行旋转变换即可与基准图进行匹配。 在水平飞行及跃升阶段,由于角度、距离等因素的制约所获取的实际图像较基准图变化较大。首先对实际图像进行快速多尺度小波变换,提取图像的边缘。然后,通过边缘信息计算旋转角度、放缩倍数等。最后与基准图像进行匹配即可。

3总结

仿射变换 篇3

1999年, LOWE D在总结现有特征算法的基础上提出了尺度不变特征变换SIFT (Scale Invariant Feature Transform) 算法[1], 并于2004年总结完善[2]。该算法提取的稳定特征点对旋转、亮度变化、尺度变化保持不变性, 对视角变换、仿射变换也有一定程度的稳定性, 因此在图像配准中得到了应用, 如参考文献[3-4]将SIFT用于图像配准领域, 除此以外也衍生了一系列改进算法, 如利用主成分分析的PCA-SIFT[5]。但是SIFT本身始终存在抗仿射性弱以及计算效率低的缺点。针对以上缺点, BAY H等人于2008年提出了一种加速的鲁棒性特征SURF (Speeded Up Robust Feature) 算法, 该算法是对SIFT的一种改进方法, 其性能在各方面接近或超越了SIFT算法, 在保持性能的同时, 计算速度是SIFT的3倍, 参考文献[6]对此进行了比较详细的阐述。参考文献[7]提出了一种基于SURF和Cam Shift的物体跟踪方法, 利用SURF算法找到跟踪窗口与初始窗口的色彩相似度, 最终实现对物体的跟踪。

尽管上述算法在特征描述和特征匹配方面取得了较好的效果, 但是, 这些算法并没有在仿射变换上得到更好的改进。针对这个问题, Random ferns[8]算法通过对以特征点为中心的子块进行仿射变换, 利用像素比对信息构造快速分类器, 在加快匹配速度的同时提高了对视角变化的鲁棒性。2009年, Jean-Michel Morel等人提出了ASIFT算法[9], 该算法具有完全仿射不变性, 能够解决SIFT和SURF在仿射性方面的缺陷, 但ASIFT算法计算量复杂, 难以在实时系统中使用。

本文通过对以上算法的深入研究和总结, 提出了一种基于仿射变换的SURF描述符。该算法利用透视投影模型来模拟成像过程, 然后将仿射变换后的图像利用SURF算法进行匹配。通过3组不同类型图像的实验证明, 本文算法比SIFT、SURF、MSER (Maximally stable extremal regions) [10]算法要好。

1 SURF描述符

SURF描述符的建立主要包括特征点检测与特征点描述两个主要步骤。

1.1 特征点检测

假如给定图像I中的一个点x (x, y) , 则在x处, 基于尺度空间Hessian矩阵H (x, y) 定义为:

其中, Lxx (x, σ) 是高斯二阶微分在点x处与图像I的卷积, Lxy (x, σ) 与Lyy (x, σ) 具有类似的含义, σ为尺度因子。

SURF采用盒子滤波 (Box Filter) 的方法来近似代替高斯滤波。假设盒子滤波器估计值分别为Dxx、Dyy和Dxy, 这样可以得到Fast-Hessian行列式的定义:

在求得Fast-Hessian矩阵行列式的响应图像后, 对空间3×3×3邻域内所有点进行非最大值抑制, 将最值作为候选的特征点, 然后采用线性插值法得到特征点的准确位置。

1.2 SURF特征点描述

为了保证得到的特征矢量具有旋转不变性, 需要为每一个特征点分配一个主方向。统计以特征点为中心, 以6s (s为特征点尺度) 为半径圆形区域内, 利用Haar小波滤波器在x, y方向进行响应, 并使用σ=2s的高斯加权函数对Haar小波进行高斯加权, 离特征点越近响应贡献越大。然后, 在60°的扇形区域内求出x和y方向上的系数之和, 并构建一个新的向量, 接着遍历整个圆形区域, 选择最长向量方向为主方向。

选定方向后, 以特征点为中心, 构建一个20σ×20σ的正方形窗, 并沿主方向将方形窗分成4×4个子块, 计算每个子块的dx、dy, 并用高斯函数进行加权, 得到每个子块的矢量V子块:

最后再对特征矢量进行归一化处理。

2 基于仿射变换的SURF描述符

本文为了解决SURF仿射性能上的不足, 在其基础上模拟了经度角和纬度角两个参数。

2.1 仿射模拟

摄像机投影模型可以用描述为:

式中, u0表示平面数字图像;T和R表示由相机引起的平移和旋转变换;A表示仿射投影;G表示高斯视觉模型;S表示网格采样。u为最终获取的平面图像。

为了简化该模型, 结合相机的运动方式与仿射变换形式, 可以得到如下定理。

定理:对于任意的仿射矩阵A可以分解为:

其中, λ为缩放尺度参数, λ>0;;Tt为倾斜矩阵, 该矩阵第一个特征值t>1, 第二个特征值t=1;为旋转变换矩阵。

2.2 Affine-SURF描述符

Affine-SURF描述符的建立过程如下:

(1) 仿射采样获取参数ф和θ

获取参数的过程就是对待匹配图像进行经度角与纬度角采样的过程。首先, 对纬度角采用等比数列采样:1, a, a2...an, a>1。当时, 采样的精度和稀疏度可以达到平衡, 本文n=5;然后, 对经度角进行等差采样:0, b/t, ...kb/t, 其中b取72°, t=|1/cosθ|, k为满足条件kb/t<180°的最后一个整数。

(2) 获取仿射变换后的图像

将步骤 (1) 得到的序列参数带入下式:

其中, I为输入图像, I′为仿射模拟图。

(3) 对输出的仿射图像进行特征点检测

(1) 首先计算仿射图像的积分图像。积分图像I在X= (x, y) 处的定义为:

(2) 然后利用式 (2) , 获得Fast-Hessian矩阵行列式, 并得到响应图像。

(3) 接着采用最大值抑制搜索技术, 在位置和尺度上对响应图像进行特征点搜索。

(4) 对得到的特征点分配方向。

(4) 构造Affine-SURF描述符

通过计算图像的Haar小波响应, 然后统计Σdx, Σd|x|, Σdy, Σd|y|来形成特征矢量。

经过以上步骤就得到了具有较强仿射性能的Affine-SURF描述符。

3 基于仿射变换的SURF图像配准

得到Affine-SURF描述符后, 用其进行特征匹配。本文中, 首先采用比值提纯法进行特征点粗匹配, 接着采用鲁棒性较强、可靠性好的RANSAC算法[11]进一步提纯, 得到最终的匹配对。

4 实验与结果分析

本文在VS2010平台上验证该算法的性能。实验的评价指标为图像在不同仿射情况下获取的正确匹配对数目。

第一组实验主要分析弱视角变化对算法的影响。以图1为例, 图像Box由于相机的视角变化, 存在着旋转、弱透视形变等现象, 图1 (c) ~图1 (f) 分别为SIFT、MSER、SURF和Affine-SURF算法的匹配结果, 它们的匹配结果如表1所示。通过对比正确匹配对的数目可以看出, Affine-SURF有效地克服了视角变化对特征提取与描述的影响。

第二组实验主要用来评价不同算法在尺度变化方面的鲁棒性。以图2为例, 图像Book由于拍摄高度不同, 导致出现尺度变化。从图2 (c) ~图2 (f) 以及表1可以看出, Affine-SURF算法有较好的匹配效果, 而且比其他3种算法能够获取更多特征点。这说明Affine-SURF能够在尺度变化明显的情况下获得更多正确的匹配点。

第三组实验主要用来验证算法在仿射形变较大情况下的性能。以图3为例, 图像People由于旋转、视角变化过大, 导致仿射形变明显。图3 (c) ~图3 (f) 分别为SIFT、MSER、SURF和Affine-SURF算法的匹配结果, 结合表1可以看出, 采用本文提出的Affine-SURF算法找到的正确匹配特征点最多, 证明了该算法对大视角变化的仿射图像匹配鲁棒性最好。

SIFT、SURF图像配准算法已经被验证对于尺度变化、旋转、亮度变化具有较好的不变性, 但是它们不具有很好的仿射性。因此, 本文提出一种基于仿射变换的SURF图像配准算法。通过3组不同图像类型的实验结果表明, 采用本文算法比SIFT、SURF、MSER算法能够得到更多的正确匹配点, 更好地提高算法的仿射鲁棒性。

摘要:传统的SURF算法对仿射变化较大的图像配准效果差。为此, 提出了一种仿射-加速鲁棒性特征 (Affine-SURF) 的图像配准算法, 通过增加经度角和纬度角不变特征引入仿射形变参数来模拟图像在不同角度的变形。实验结果表明, 与SIFT、SURF、MSER等配准算法相比, 该算法能够获得更多特征匹配对, 提高了算法对仿射变化的鲁棒性。

关键词:SURF,仿射,图像配准,affine-SURF

参考文献

[1]LOWE D.Object recognition from local scale-invariant features[C].In:Proceedings of the 7th IEEE International Conference on Computer Vision, Corfu, US:IEEE, 1999:1150-1157.

[2]LOWE D G.Distinctive image features from scale-invariant keypoints[J].International Journal of Computer Vision, 2004, 60 (2) :91-110.

[3]Zhao Wanglei, NGO C W.Flip-invariant SIFT for copy and object detection[J].Image Processing, IEEE, 2013, 22 (3) :980-991.

[4]张瑞年.联合时空SIFT特征的同源视频检测[J].电子技术应用, 2012, 38 (3) :130-133.

[5]JUAN L, GWUN O.A comparison of SIFT, PCA-SIFT and SURF[J].International Journal of Image Processing (IJIP) , 2009, 3 (4) :143-152.

[6]BAY H, ESS A, TUYTELAARS T, et al.Speeded up robust features (SURF) [J].Computer Vision and Image Understanding (CVIU) , 2008, 110 (3) :346-359.

[7]路宁.基于SURF和CamShift的物体跟踪方法[J].微型机与应用, 2012, 31 (27) :40-43.

[8]OZUYSAL M, CALONDER M, LEPETIT V, et al.Fast keypoint recognition using random ferns[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2010, 32 (3) :448-461.

[9]MOREL J M, YU G S.ASIFT:a new framework for fully affine invariant image comparison[J].SIAM Journal on Image Sciences, 2009, 2 (2) :438-469.

[10]MATAS J, CHUM O, URBAN M, et al.Robust widebaseline stereo from maximally stable extremal regions[J].Image and Vision Computing, 2004, 22 (10) :761-767.

仿射变换 篇4

在光刻领域中,光刻投影物镜、掩模硅片对准系统、激光定位工件台并称为投影光刻机的三大核心部分[1]。对于高密度的印刷电路板布线或者集成电路芯片,需要进行套刻曝光,而套刻精度取决于掩模硅片对准系统的对准精度。如图1,以投影光刻系统为例,系统中的平移台与硅片基板之间的支承部件是具有θ、Δx、Δy三个自由度的数控三维微调对准装置①,该装置实现套刻的过程需要使用图像匹配技术。图像匹配是在同一场景中采集到的两幅图像,分别为CCD1 拍摄的目标图像②、CCD2 拍摄的待对准图像③,提取出角点信息后,根据获取的信息将待对准图平移旋转匹配目标图像的过程,隶属于光电图像处理中控制点仿射变换模型,寻求控制点仿射变换的快速匹配运算算法,在机器视觉和模式识别等相关领域有重要应用价值[2,3,4]。其中,④~⑥分别是投影光刻系统中的投影系统、照明系统和准分子激光器。

目前求取仿射变换参数大多都是采用迭代法来求得,需要经过多次迭代求取套刻对位的控制参数,不适用于生产率较高的实时控制型曝光设备。本文首次提出了国内外未见报道的一套求解仿射变换最优匹配参量的计算公式,其核心是基于仿射变换单应矩阵最小二乘运算模型,一步直接计算出最接近理想值的平移旋转参量,以替代传统的Levenberg-Marquardt最小化ML代价函数的迭代过程[5],在光刻系统上实现了实时对位的功能。

1 仿射变换参量计算

图2 和图3 为实验过程中需要实现对位的目标图与待对准图。对位算法实施前,需要进行图像二值化、阈值分割、高斯平滑、边缘轮廓提取、角点检测等图像预处理的过程[7,8,9]。

其中角点检测和提取的方法有很多,目前,常用的角点提取算法有Moravec算法、Forstner算法、SUSAN算法、Harris算法和SIFT算法[10]。图2 和图3 中的点采用Moravec算法提取得到的角点坐标,并将坐标的x、y分量排列成列矩阵的形式(记“待对准图的角点坐标集P”为Px、Py;记“目标图的角点坐标集Q”为Qx、Qy)。以图2、图3 为例,角点的数目为N=98,则Px列矩阵为由N个整数x坐标所组成的单列矩阵,Py、Qx、Qy如此类推。

于是,可根据上述四个列矩阵以及一个单位列矩阵E(由N个1 排列而成的单列矩阵),运用如下公式

单步计算得到两幅图像的平移参量Δx、Δy、旋转参量θ。

2 公式推导

式(1)~式(3)是本文的理论核心,运用仿射变换单应矩阵的最小二乘数学模型推导所得,关键的推导过程如下。“待对准图的角点坐标集P”中的第i个坐标点,旋转θ角、平移Δx、Δy后得到的理想坐标P'xi、P'yi分别为

记x1=cosθ,x2=Δx,x3=Δy,则在0°≤θ<90°(此时在图像坐标系中)情况下式(4)可改写为

于是P'xi、P'yi与Qxi、Qyi的距离误差累积函数为

为使所有理想点与对应目标点最接近,令函数F对x1,x2,x3的偏导数为零,可衍生得三个方程:

由此求解得tanθ 的表达式为

式(10)在0°≤θ<90°时得式(1)。

式(10)在90°≤θ<180°时得:

式(10)在180°≤θ<270°时依然为式(11),

在270°≤θ<360°时重回式(1)。

无论θ的求解采用式(1)或(11),代入式(7)、(8)后皆可求得式(2)、(3)。

3 实验结果

实验上从两方面来验证该算法的有效性。

第一方面:以目标图(图2)为模板图,将图2、图3 中提取的角点坐标矩阵代入式(1)~式(3)求取平移旋转参量,所求得的θ、Δx、Δy就是机械控制模块的控制参量,电机控制运转后,待对准图从原来的图3 拍摄效果变为如图4 的拍摄效果。

比对图2 与图4 可见,待对准图实施该算法所得到的控制过程后,完全实现了准确的对位。比对的方式是采用两个评价函数定量分析,分别为建立起映射关系的单应角点之间的平均几何距离误差,如式(12)所示Dalg:

其中:Px′ 、Py′ 为“待对准图施行参量控制后的图的角点坐标集P' ”的x坐标列矩阵、y坐标列矩阵,N为角点数目,i=1,2,3,…,N。

另一个评价函数为施行参量控制后的待对准图与目标图之间的逐点灰度平均误差Earv:

其中: D' 为施行参量控制后的待对准图对应像素点的灰度值,D为目标图对应像素点的灰度值,X ·Y为图像的像素点个数。

以图2、图3 所计算得到θ=-27.897 7o、Δx=61.209 3、Δy=-34.183 5、Dalg=0.370 5、Earv=6,从Dalg小于1 以及Earv小于10,从而证明了该算法实现了亚像素级的对位效能。

另外,为证明该算法在各个旋转域的有效普适性,我们从如下的方面实施数值模拟实验:对待对准图旋转任意角度θ(平移参量Δx、Δy为固定值),求出旋转后的角点坐标矩阵,代入公式求出平移旋转参量,并将求出的参量(θ1、Δx1、Δy1)与输入的参量对比。分别在[-90o,90o)与[90o,270o)两个区间测试(平移参量Δx、Δy为固定值时,输出参量Δx1、Δy1与输入参量Δx、Δy相比基本相等),测试的结果如图5(a)、(b)所示(θ为水平轴,θ1为纵轴)。

由图5(a)知,输入输出的角度参量θ、θ1在坐标轴上呈线性相关(除θ=90°时的点),即当θ在(-90°,90°)范围时,输出参量和输入参量相比均在误差允许范围内(误差为0.1°),可以说明式(1)~式(3)在此范围内均适用;由图5(b)同样可知,输入输出的角度参量θ、θ1在坐标轴上呈线性相关,即当θ在[90°,270°]范围时,输出参量和输入参量相比均在误差允许范围内(误差为0.1°),所以式(2)、式(3)、式(11)在θ为[90°,270°]时均适用。由以上数据分析可得,θ在各区域范围所求的参量均在误差允许范围内,所以本文提出的公式在0°≤θ≤360°均适用。

另从运算时间上看,该组公式算法从开始到得出参数仅需0.081 6 ms的时间(VC6.0 编译),远快于传统迭代方式的运算时间8 ms,验证了该算法的可实时性及效率大大地提高[11]。

4 结论

本文提出了一种基于仿射变换单应矩阵最小二乘运算模型,直接计算出平移旋转参量的方法,相比传统的迭代运算方法,单步即可求得图像的平移旋转参量,并且通过实验验证了该方法的有效性。在众多需要实时对位的应用领域上,本文提出的方法具有很大的实效优势。

参考文献

[1]姚汉民,胡松,邢廷文.光学投影曝光微纳加工技术[M].北京:北京工业大学出版社,2006:83-129.YAO Hanmin,HU Song,XING Tingwen.Optical projection exposure micro-nano processing technology[M].Beijing:Beijing Industry University Press,2006:83-129.

[2]雷亮,李浪林,周金运,等.投影光刻系统中的掩模硅片相关识别对准技术[J].量子电子学报,2012,29(6):764-768.LEI Liang,LI Langlin,ZHOU Jinyun,et al.Correlation recognition and alignment technology of mask in projection lithography system[J].Chinese Journal of Quantum Electronics,2012,29(6):764-768.

[3]王小鹏,房超,雷涛.一种平移旋转图像的角点匹配方法[J].计算机工程与应用,2014,50(16):173-176.WANG Xiaopeng,FANG Chao,LEI Tao.Corner matching method for translation and rotation image[J].Computer Engineering and Applications,2014,50(16):173-176.

[4]陈杭,杜小平,夏鲁瑞,等.基于控制点的一种高光谱图像配准方法[J].装备学院学报,2013,24(3):109-113.CHEN Hang,DU Xiaoping,XIA Lurui,et al.Registration method for hyperspectral image based on control points[J].Journal of Academy of Equipment,2013,24(3):109-113.

[5]刘彬,陈向宁,郭连朋,等.一种基于多重单应引导的特征点匹配算法研究[J].信息工程大学学报,2013,14(5):591-595.LIU Bin,CHEN Xiangning,GUO Lianpeng,et al.Feature Point Matching Algorithm Based on Multiple Homography[J].Journal of Information Engineering University,2013,14(5):591-595.

[6]R Hartley,A Zisserman.Multiple View Geomet[M].Cambridge University Press,2000:416-418.

[7]江明,刘辉,黄欢.图像二值化技术的研究[J].软件导刊,2009,8(4):175-177.JIANG Ming,LIU Hui,HUANG Huan.Research on binarization image technology[J].Software Guide,2009,8(4):175-177.

[8]龙建武,申铉京,魏巍,等.一种结合纹理信息的三维Renyi熵阈值分割算法[J].小型微型计算机系统,2011,32(5):947-952.LONG Jianwu,SHEN Xuanjing,WEI Wei,et al.3-D Renyi Entropy Thresholding Algorithm Combining with the Texture[J].Journal of Chinese Computer Systems,2011,32(5):947-952.

[9]肖茜,鲁宏伟.基于高斯平滑的自适应角点检测[J].计算机辅助设计与图形学学报,2004,15(11):1358-1361.XIAO Qian,LU Hongwei.Adaptive Corner Detection Based on Gaussian Smoothing[J].Journal of Computer-Aided Design&Computer Graphics,2004,15(11):1358-1361.

[10]杨晓晖,王文娟.图像特征点提取角点量阈值自适应选取方法[J].光学与光电技术,2012,10(5):72-75.YANG Xiaohui,WANG Wenjuan.Threshold adaptive selection method for corner detection of image feature points[J].Optics&Optoelectronic Technology,2012,10(5):72-75.

上一篇:中国象棋的编程设计下一篇:数字化摄影(DR)