图像缩放

2024-10-09

图像缩放（共5篇）

图像缩放篇1

摘要：图像尺寸的缩放变换是一种常见的操作。Java中Buffered Image类的get Scaled Instance方法可以方便的用来进行图像的缩放变换, 但是该方法在进行缩放时不能保持图像的宽高比, 文章提供了一种简单的实现保持图像宽高比的缩放算法。

关键词：图像缩放,宽高比,BufferedImage

1 引言

图像信息是人类传递视觉信息的主要媒介, 在人类的感知中扮演着非常重要的角色。图像的缩放变换是一种比较常见的需求, 在图像处理和计算机图形学中, 图像缩放是指对数字图像的大小进行调整的过程。实际应用中, 经常需要对数字图像进行缩放变换。图像的缩放变换是非平凡的, 在进行缩放处理时, 需要在处理效率和变换后图像的平滑度及清晰度上做出选择。图像缩放变换的方法很多, 以插值算法较为常见。

2 保持图像宽高比的图像缩放

无论在应用中实现哪种插值算法, 都需要程序员对数字图像处理有较多的理解, 其算法的实现也较为复杂。在Java语言中, java.awt.image.Buffered Image[1,2]类实现了get Scaled Instance方法可以方便的用来进行图像的缩放变换。get Scaled Instance方法需要三个参数, 第一个参数指定缩放后图像的宽度, 第二个参数指定缩放后图像的高度, 第三参数指定缩放时使用的算法类型, 可取的类型为SCALE_DEFAULT, SCALE_FAST, SCALE_SMOOTH, SCALE_REPLICATE, SCALE_AREA_AVERAGING。但是get Scaled Instance方法在进行图像缩放变换时若原图像的宽高比与指定的宽高值比不一致, 则不能保持图像纵横比, 会使变换后的图像发生畸变。本文提供一种基于get Scaled Instance方法的简单算法, 可以在进行图像缩放时保持图像纵横比。

2.1 算法设计思想

假设待缩放图像的宽度为src W, 高度为src H, 宽高比为rs。缩放目标宽度为width, 高度为height, 宽高比为rd。图1中可以很容易地看出, 当宽度比rs<=rd时, 变换后图像的高度不能大于目标高度, 因此变换后的图像高度可取目标高度, 变换后图像宽度则应该为目标宽度乘以原图像的宽高比;宽度比rs>rd时, 变换后图像的宽度不能大于目标宽度, 因此变换后的图像宽度可取目标宽度, 变换后的图像实际图像高度等于目标高度除以原图像的宽高比。

由此可得算法步骤:

(1) 取得原图像的宽度和高度, 计算原图像的宽高比;计算目标宽度和高度的宽高比。

(2) 若原图像的宽高比小于等于目标宽高比, 则变换后的图像的实际高度等于目标高度, 而变换后的图像实际图像宽度等于目标宽度乘以原图像的宽高比。若原图像的宽高比大于目标宽高比, 则变换后的图像的实际宽度等于目标宽度, 而变换后的图像实际图像高度等于目标高度除以原图像的宽高比。

(3) 由步骤 (2) 所得宽度和高度对图像进行缩放变换。

2.2 算法实现

由以上设计思想可编写方法如下:

3 结语

文章给出了一种基于Buffered Image.get Scaled Instance方法的保持图像纵横比的图像缩放算法。算法简单, 易于编程实现。

参考文献

[1]Ken Arnold James, Gosling David Holmes.Java程序设计语言[M].北京:人民邮电出版社, 2006.

[2]Oracle Corporation.Java API Documentation[EB/OL].http://www.oracle.com/technetwork/java/api-141528.html.

图像缩放篇2

数字图像取证技术可以分为主动取证和盲取证两大类。数字水印技术[1,2,3]是主动取证中的主要标志性技术,但这是一种主动取证方法,需要对图像进行预先处理,大大限制了其应用范围。数字图像盲取证技术[4,5]因为其更广泛的应用范围而受到越来越多的重视,盲取证技术不需要预先向图像中加入标识版权的先验信息,而是直接对取自各种来源的数码图像进行真实性和原始性的鉴别。

细缝裁剪( Seam-carving) 方法[6]是由Avidan, Shai提出的一种基于内容的图像缩放技术。这种技术通过计算各个像素的能量值来有目的的选择“细缝”(Seam),通过复制或移除细缝来达到放大或缩小图像的目的。细缝的选择标准决定了复制或移除细缝对图像重要细节的影响最小,从而达到视觉上的失真最小。细缝裁剪技术因其独有的优势而迅速被承认并且大面积使用,比如,该项技术已经加入到Adobe Photoshop CS4中使得一般操作者也能更容易的使用。细缝裁剪技术还可以通过删除经过指定区域的细缝来实现对图像中某个物体的移除而达到篡改的效果。但是迄今为止针对采用细缝裁剪技术进行图像篡改的相应的检测技术还没有被更多的重视和开发。在仅有的文献中,Min Wu提出了一种基于哈希的预测判别方法[7],这是一种主动取证方法, 应用受到一定限制;Fillion C提出了一种融合特征后用于SVM ( Support Vector Machine) 训练的方法[8],但是识别的准确率和成功率不高。

本文采用提取正常图像和经过细缝裁剪篡改后的图像的马尔科夫特征,并用SVM进行训练,来达到区分正常图像和细缝裁剪篡改图像的目的,实验结果表明本文所提方法取得了良好的的检测效果。

1细缝裁剪方法

细缝裁剪就是通过复制或者移除“细缝”来实现图像缩放的目的,所谓“细缝”是根据能量值来选定的一条竖直方向或水平方向的一条线,以垂直细缝为例,这条线是从上至下的一条曲线,该曲线在图像每一行都有且仅有一个像素,曲线上相邻2个像素之间是八连通的,这保证了是一条连续的曲线。关于细缝需要说明以下两点:1细缝的选择是基于像素能量的大小来选取,这里选用式(1) 计算所得出的能量值来进行比较选取;2之所以要细缝上相邻像素八连通从而实现整条细缝是一条连续的曲线,而不是直接选取每一行(以垂直细缝为例)的能量值最低的像素直接复制(放大时)或者删除掉(缩小时),是因为每列能量值最小的像素一般分散分布,直接复制或删除这些像素将会产生比较严重的不连续视觉效果,造成很明显的人为失真痕迹。

对于大小为N1× N2大小的图像,用式(2) 定义一条垂直细缝:

式中,某条竖直细缝包含的像素集由s表示。该竖直细缝含有N1个像素,{ai,bi}iN=11表示N1个像素的坐标集((a,b)代表图像中第a行第b列)。

根据式(2),可以用Is= {I(si)}iN=11= {I(i,x( i)}iN=11来表示细缝的所有像素,那么在若干条细缝中,通过式(3)求得在缩放过程中起关键作用的最优细缝, 也就是总能量值最小的细缝:

细缝的查找过程采用动态编程技术实现,从第2行开始对每个像素( i,j) 计算其M( i,j) 的值:

通过式(4)可以看出,首先逐一检查上一行与当前像素八连通的3个相邻像素的能量值,找到值最小的像素,将当前元素能量值与该像素能量值相加作为当前像素的最终能量值,依次按照以上策略进行计算并记录路径,这样当计算到最后一行的时候,该行每个像素的能量值就是某条细缝的能量累加值,通过对最后一行像素的能量值的遍历可以找到总能量值最低的细缝在最后一行像素的位置,通过此像素进行回溯,就可以找到整条细缝,这种能量值最低的细缝将在图像缩放过程中发挥最大的作用。

当图像需要放大时,通过复制最优细缝来实现。如果细缝中的某个像素是a2,它的复制决定于它附近的2个像素,比如{a1,a2,a3},复制细缝后为{a1b1,b2,a3},b1 、b2通过式(5)求得:

如果a2恰好处在图像的边缘,比如{a1,a2},则复制细缝后为{a1,b,a2},b的值由式(6)求得:

图像通过插值和细缝剪缩放后的效果对比如图1所示。

通过图1可以看出细缝裁剪技术在图像缩放方面体现出的优越性。用插值方法得到的缩放图像对使得图像的细节发生了变形和失真,而使用细缝裁剪方法得到的缩放效果在最大程度上保证了图像细节不发生变化,因此视觉效果最好。

2基于马尔科夫特征的细缝裁剪篡改检测

2. 1特征提取

一般来讲,通过数码设备获取的数字图像,相邻像素之间存在一定的关联关系。细缝裁剪通过细缝的插入和删除来实现图像的缩放,这个过程必然会明显的影响插入或删除细缝相应区域的相邻像素的相关性。

马尔科夫过程可以很好的描述像素间的相关性以及空间上的连续性变化。通过计算图像频域(比如DCT域)的马尔科夫转移概率矩阵,提取相应特征,加以训练,使其能够用以区分正常图像和经过细缝裁剪篡改后图像,具体步骤如下:

1对源图像进行8 × 8块离散余弦变换从而得到DCT系数矩阵。

2 DCT系数矩阵取整,然后取绝对值( 得到矩阵F)。

3计算F的差矩阵( 水平、竖直、对角线、反对角线4个方向):

4设置阈值T(正整数),对Fh、Fv、Fd、Fm中的所有元素值验证,> T或者 < - T,则改为T或者 - T。

5对Fh、Fv、Fd、Fm分别求各自对应方向的转移概率矩阵:

式中,i,j∈{-T,-T +1,-T +2,…0,…,T -2,T -1,T};su, sv表示图像的原始行数和列数,当括号内条件成立时 δ ( ·) = 1,否则 δ( ·) = 0。

6将式(8)所求得的转移概率矩阵的所有元素作为特征。维数为(2T +1) × (2T +1) ×4 =324(T =4)。

2. 2分类训练

由于支持向量机(SVM)[9]在小样本高维数据的分类表现出很好的性能。本文采用使用RBF核的LIBSVM[10,11]。分类过程将所有未经篡改的正常图像标为“- 1”,所有经过细缝裁剪篡改的图像标为“1”,从而将问题转化为一个二值分类问题。使用LIBSVM首先对混合图像集进行训练,该训练集包含原始图像和篡改图像。将训练的结果用于含正常图像和按各种比例缩放的篡改图像的测试集进行分类测试。

3实验结果分析

实验对灰度图像和彩色图像两大类进行分别测试。针对灰度图像的实验采用在数字图像取证领域最广泛使用的哥伦比亚大学图像库,该图像库由933张正常图片和912张拼接图片组成。由于图像库涵盖了11大类各种纹理情况的图像,因而在此图像库上的实验结果具有很好的可信性。11类图像的具体纹理特征如表1所示。

实验采用11大类共933张正常图片作为正常图像库并针对每一类正常图像使用细缝裁剪技术产生篡改图像库。其中,分别对正常图像进行0. 5、0. 8比例的缩小和1. 2、1. 5比例的放大。共得到包含4 × 933 = 3 732张篡改图像的篡改图像集。包含933张的正常图像集和3 732张的篡改图像集将为SVM的训练和分类测试提供所有需要的图像。图片实例如图2所示。

彩色图像采用CASIA 2. 0,该库包含7 491张正常图像和5 123张篡改图像。图像大小从240 × 160到900 × 600不等,并且包含未压缩图像和不同压缩比例因子的JPEG压缩图像。7 491张正常图像都是自然图像,包含场景、动物和建筑等9大类。图片实例如图3所示。

软件平台采用Matlab R2009a,硬件平台采用Intel E7500 2. 93 GHz,2 G内存的台式机。大量实验表明,差矩阵和转移概率矩阵求取时取T = 4可以达到最好的效果。

针对灰度图像库,对含有正常图像和篡改图像各300幅(随机挑选)的训练集进行训练,然后对11大类图像逐一选取正常和篡改后各100幅图像(随机挑选)分别检测正确率,结果如表2所示。

TPR( True Positive Rate) 代表在所有待检测篡改图像中正确检出的比率; TNR ( True Negative Rate) 代表在所有待检测正常图像中正确检出的比率。Accuracy代表所有待检测正常和篡改图像总的正确检出比率。Total代表所有11 × 100 × 2 = 2 200幅测试图像总的检测正确率。

针对彩色图像库,在9大类共7 491张正常图片中,每类随机选取200张图片,共200 × 9 = 1 800张;每类中随机选取50张并用细缝裁剪进行比例为50% 、80% 、120% 和150% 的缩放,共得到50 × 9 × 4 = 1 800张缩放篡改图片; 每类随机选取50张并使用细缝裁剪移除部分图片细节,得到50 × 9 = 450张篡改图片:训练集即由1 800张正常图片和1 800 + 450 = 2 250张篡改图片组成。测试集由所有7 491张正常图片和2部分篡改图片组成:一部分是每类中随机选取200张并按50% 、80% 、120% 和150% 比例缩放后的200 × 9 × 4 = 7 200张;一部分是每类中随机选取50张并用细缝裁剪方法去除部分图像细节的共50 × 9 = 450张。测试结果如表3所示。

从表2和表3可以看出,基于马尔科夫特征的检测方法检测经过细缝裁剪篡改过的图像具有很高的准确率。从表2可以看出,算法针对纹理较强的图像表现出更高的识别准确率,针对平滑图像表现略差,原因是纹理丰富的图像像素间的变化更显著, 体现在相关性上就更强,在转移概率矩阵中也就具有更明显的特征。考虑到篡改图像基本都是纹理较为复杂的图像,所以本算法在实际应用中应该具有很强的分辨识别能力。从表3可以看出,算法在彩色图像库的检测结果比灰度图像库略差,这应该归因于彩色图像库的图像大小变化和不同压缩比例的JPEG图像的影响。

ROC( Receiver Operating Characteristic Curve) 曲线能够直观地反映出算法分类的效果,采用TPR作为纵轴,FPR(被错认为篡改图像正常图像的数目占测试集中所有正常图像的比例)作为横轴。曲线的AUC( Area Under the Curve) 值越高表明分类的效果越好,分类测试所得ROC曲线如图4所示。通过图4可以看出,基于马尔科夫特征的算法ROC曲线有很好的AUC值,在实际分类中会取得很好的效果。

4结束语

图像缩放篇3

随着4G高速网络商用速度加快和智能手机的普及, 业界对视频、应用、社交互动、游戏等多媒体应用的竞争日趋激烈。为了满足视频、游戏、社交互动等业务对图像处理能力及质量要求, 移动增值业务提供商必须提供实时大容量的图像处理服务。图片作为信息传递、表达的重要载体, 如何快速高质量地传输图像是人们一直关注的课题。

经典的图像缩放算法有:最近邻插值法、双线性插值法[1]、双立方插值[2]、小波分解[3]、偏微分方程[4]等。当用最近邻插值对手机上的图像进行缩放时, 处理速度快, 但有轻微锯齿现象;双三次插值比双线性插值计算复杂、速度较慢, 效果较好。

作者提出一种基于NDK双线性快速图像插值去噪放大算法, 首先基于NDK进行双线性插值放大, 然后再用中值滤波去噪。实验证明它不仅与双三次插值一样的效果, 而且运行速度快, 适合于手机图像插值应用。

1. NDK双线性快速图像插值去噪算法

1.1 双线性插值方法

双线性插值方法[1]是最为常用的图像缩放方法, 它需要通过对输入图像中距离其最近的4个像素的灰度值采用加权平均运算得出。该算法对图像进行放缩后的新图像的像素值, 需要由四个采样点的像素值来决定, 如图1所示。

由图1可知, 插值点f (i+u, j+v) 是图像放大后需要插入的像素点, 该点周围上下左右的四个像素点f (i, j) , f (i, j+1) , f (i+1, j) , f (i+1, j+1) 为双线性插值需要运算的四个顶点。其计算公式如 (1) 式所示。由公式 (1) 可知, 离插值点越近的点对其像素值得贡献越大, 而插值点越远的点对E点像素值得贡献也就越小。

1.2 基于NDK的双线性插值

Android NDK (Native Development Kit) 是一套工具集合[5], 允许开发者使用像C/C++语言那样实现应用程序的一部分。在开发过程中需要使用JNI机制进行调用。JNI是一种在Java虚拟机控制下执行代码的标准机制。NDK主要是通过JNI从Java代码调用C代码 (即Native编程) , 它主要为上层Java代码提供库函数 (动态库或是静态库) , 但不全部使用Native C代码编写整个Android应用。

在应用程序层中Android NDK通过Java的JNI方式调用C/C++类, C++类定义如下:

1.3 中值滤波去噪

中值滤波[6]是把序列或数字图像中一点的值, 用该点邻域中各点值的中值来替代。二维中值滤波定义如下:设{xij, (i, j) ∈I2}表示数字图像各点的灰度值, 滤波窗口为A, yij为窗口是A在xij点的中值, 则

式 (2) 为A窗口的xij点的中值表达式, 中值滤波窗口既可以是方形, 也可以取近似圆形或十字形。

2. 实验结果

作者使用小米1S手机开发了该图像缩放系统, 并在小米1S手机上进行了测试。

2.1 主观质量比较

由于手机屏幕的限制, 如果放大倍数过小则不能从主观质量上反映算法的优良, 反之如果放大倍数过大则不适合于手机图像插值应用。因此作者对所有图像只进行放大2倍比较。图2、图3为各种算法插值效果图。其中图2和图3都是将原图像先缩小2倍, 然后再放大2倍的图像缩放图。

/d B

从图2和图3可以看得出, 在平滑区域中经NDK双线性插值去噪处理的图像伪边缘数比双立方插值算法少。

2.2 客观质量比较

在客观质量的评价中, 作者使用lena (512×512) 和pepper (512×512) 作为测试图像。在灰度空间上, 先将原始图像进行缩小2倍, 然后再使用各种插值算法放大2倍, 将对放大后的图像与原始图像进行峰值信噪比PSNR (Peak Signal to Noise Ratio) [7]和结构相似度MSSIM (Structural similarity) [8]的定量分析, 分析结果如表1、表2所示。

其中, X是大小为M×N的原始图像, Z是原始图像由某一算法放大再缩小后 (或缩小再放大后) 的目标图像。理论上, PSNR (X, Z) 值越大, 则图像缩放效果越好。

由表1、表2知NDK双线性去噪算法所得到图像的PSNR值和MSSIM值均优于双线性、双三次、NDK双线性插值和最近邻插值。

2.3处理时间比较

在处理时间的评价中, 作者使用lena (512×512) 和pepper (512×512) 作为测试图像。先将原始图像进行缩小2倍, 然后再使用各种插值算法放大2倍, 记录各种算法的处理时间。各种算法的处理时间如表3所示。

(单位:毫秒)

从表3可以看出, 双立方插值时间最长, 为NDK双线性插值时间的40倍, 其次是双线性插值、最近邻插值、NDK双线性插值去噪, NDK双线性插值时间最短。

NDK双线性插值去噪算法无论从主观质量或客观质量上都与双立方插值算法效果相当, 并且其处理时间只有双立方插值算法的1/20, 在处理时间上有很大的优势。

3. 结论

本文提出了一种基于NDK双线性插值去噪算法图像放大方法。在双线性插值的基础上, 通过NDK使用JNI调用C++的双线性插值函数对图像进行放大, 然后使用JNI调用C++的中值滤波函数对图像去噪。实验证明该算法的缩放质量不仅与双三次插值达到一样的效果, 而且运行速度快, 适合于手机图像缩放。

摘要：为了较快较好地获得手机图像的显示效果, 本文提出一种基于NDK双线性插值去噪缩放算法。首先用NDK对手机图像进行双线性插值缩放, 然后再用中值滤波去噪。实验结果表明, 该算法比普通双线性插值算法边缘更加清晰, 处理速度更快, 提高了图像的质量。

关键词：双线性插值,NDK,图像缩放

参考文献

[1]Blu T, Thévenaz P, Unser M.Linear interpolation revitalized[J].IEEE Transactions on Image Processing, 2004, 13 (5) :710~719.

[2]R.G.Keys.Cubic convolution interpolation for digital image processing[J].IEEE Transactions on Acoustics, Speech, Signal Processing, 1981, 29 (6) :1153-1160.

[3]Rafael C.Gonzalez, Riehard E.woods.数字图像处理 (第2版) [M].北京:电子工业出版社.2005:276-321.

[4]张慧玉, 祝轩, 王蕾.基于PDE的图像放大方法研究[J].西安石油大学学报:自然科学版, 2009, 24 (5) :79-81.

[5]孙松.基于Android NDK的智能灯光系统的设计与实现[D].重庆大学硕士学位论文, 2014:15-22

[6]桂预风、陶剑锋.数字图像中值滤波改进算法研究[J].武汉理工大学学报 (交通科学与工程版) , 2004, 28 (1) :103-105.

[7]Wang Z, Bovik A C.Mean Squared Error:Love It or Leave It[J].IEEE Signal Processing Magazine, 2009, 26 (1) :98-117

图像缩放篇4

分辨率是成像系统的关键技术指标[1]。不同测试目的与测试环境对应的分辨率定义是不相同的。如有光学镜头分辨率、探测器分辨率、静态照相分辨率、动态照相分辨率等[2]。光学焦距是成像系统的重要技术指标, 一般情况下焦距越长对应的照相分辨率越高, 在相同工作状态下, 如相机焦距为500 mm时, 目标对应的像素为10×10, 而当焦距为1 000 mm, 该目标对应的像素为20×20, 这种变化使目标的纹理更加清晰, 有利于图像的判读。另一方面经典的缩放算法如最邻近点插值、线性插值、三次样条插值等也可以对目标进行放大[3], 有些算法还声称能保留原图像的边沿信息, 克服经典插值算法带来的边沿模糊或锯齿现象[4,5]。

光学变焦距与缩放算法对图像分辨率有什么影响, 两种方法之间有什么区别, 工程中正确理解与运用两种方法对相机设计与应用技术人员具有重要意义。本文首先深入论述了三种分辨率定义, 然后从采样理论出发详细阐述了光学变焦与缩放算法本质上的联系与区别, 最后试验验证了光学变焦与缩放算法对图像分辨率的影响。

1 分辨率分类

1.1 光学镜头分辨率

镜头对被照物体细节的分辨能力称为光学镜头分辨率, 以1 mm的宽度内能清晰分辨线对数来定义, 单位为线对/毫米。镜头分辨率是衡量相机成像质量的重要指标。由于镜头存在像差和光的衍射, 使照相镜头的分辨率受到限制。对于无像差的镜头或者像差校正到瑞利极限的优质镜头, 无限远处的物点在系统焦平面上所得的像, 决定于系统通光孔径的形状和大小, 以及光波波长的夫琅和费衍射图样, 这使光学系统由靠近的两个物点所成的像可能发生重叠, 从而限制了光学系统的分辨率。由于衍射的存在, 即使是无像差镜头的分辨率也是有限的。判别两个点经光学系统的准则主要如式 (1) 的斯帕罗准则与式 (2) 的瑞利准则。

式中:b1, b2是能分辨的最小线宽, f为焦距, λ为入射光波长, D为光学系统的入瞳孔径。

1.2 光电探测器分辨率

光电探测器的基本功能是将光学信号的二维空间分布转变为电子信息, 经过信号处理与转换等变为人眼可辨识的二维光学图像[6]。探测器接收到的自然界光学图像是连续的, 但探测器每个感光像元的尺寸是离散的, 根据Shannon采样定理, 像元截止频率为

式中P为像元尺寸, 截止频率单位为线对/毫米。

1.3 摄影分辨率

摄影分辨率指成像系统实际工作时对目标的分辨能力。测试方法为放置不同尺寸的靶标, 以成像系统能分辨的最小靶标为基准计算实际摄影分辨率, 如式 (4) 所示:

式中:R为摄影分辨率 (线对/毫米) , RG为靶标一组黑白线条宽度, H为实际照相高度, f为相机镜头焦距。

2 光学变焦与缩放算法

2.1 图像采样

缩放算法与光学变焦的目的都是要放大图像, 从而提高判图人员辨别目标的能力。自然界中的景物为连续的, 而经CCD (Charge Coupled Device) 探测器采集后的图像为离散的, 从连续信号到离散信号的转换即为经典的采样过程。地面景物采样间隔的大小如式 (5) 所示:

式中:L为采样间距, b为CCD像元尺寸大小, H为实际照相高度, f为相机焦距。根据采样定理, 采样间距越小, 截止频率越高, 采样获得的数据细节信息量越丰富[7]。

2.2 光学变焦距

变焦距镜头是一种焦距 (或倍率) 可以连续变化而像面位置保持相对稳定的镜头。变焦过程中像面尺寸一般是不变的, 因此系统的视场会因为焦距变长而减少, 如式 (6) 所示:

式中:up为相机视场角, h为探测器尺寸, f为相机焦距。虽然此时相机的视场角减少, 但光学系统的放大率增大, 如式 (7) 所示:

式中:x为景物与相机间的距离。按照式 (4) 所示, 当焦距为f时, 相机对地面景物采样间距为H/ (RGf) , 当焦距为2f时, 相机对地面景物采样间距为H/ (2RGf) , 虽然视场减少了一半, 但空间采样频率提高一倍, 景物的细节更容易分辨, 如图1所示。另一方面较大范围内的改变光学焦距对相机的相对孔径亦有影响, 而相对孔径对像面平均照度关系如式 (8) 所示:

其中:E为像面上的平均照度, D为光学镜头的入瞳直径, f为相机焦距, L为视场内景物的平均亮度, τ为镜头的透射率, β为镜头的视场角。当焦距增加1倍后像面的照度降低为原照度的1/4, 此时需要延长曝光时间才能保持图像的信噪比。

2.3 图像缩放算法

为了更好的判读目标, 一般采用缩放算法放大遥感图像, 这是因为遥感图像单个像素对应的地面景物大, 而视神经能分辨两像点间最小距离应至少等于两个神经细胞直径, 否则视神经无法分辨出两点。在良好照明时, 人眼能分辨的物点间最小角为视角分辨率, 如式 (9) 所示:

当眼睛在无调节的松弛状态下, 焦距f=23 mm, 此时ε=60″。遥感图像中感兴趣的目标放大后进入人眼的视场角随之增大, 更多的视神经参与感测目标, 从而人眼的判别能力得到增强。对一幅连续图像信号s (x, y) 采样, 当满足奈奎斯特采样定理即连续信号频谱的最高频率小于折叠频率, 则抽样后在傅里叶频率域将产生周期延拓的连续频谱s (u, v) , 并且原信号的频谱和各延拓分量的频谱彼此不重叠。所以, 仅当奈奎斯特采样定理满足时, 采用一个理想低通滤波器就能把原始图像连续信号s (x, y) 从采样后的离散信号s (k, l) 完全恢复出来。理想滤波器的脉冲响应是无限的, 工程中通常采用的缩放算法为最邻域法插值、线性插值、B样条插值、三次插值等。这些算法本质上都是利用一个低通滤波器重构原图像, 因此图像的高频分量不可避免的都会受到损失。

2.4 光学变焦与缩放算法的区别

光学变焦与缩放算法本质上的区别在于:光学变焦改变的是相机对连续景物的采样频率fc, 而缩放算法没有改变采样频率, 只是重构了1/2采样频率内的图像信息[8,9]。因此在其它条件相同的情况下光学变焦能够提高相机的照相分辨率, 而图像缩放只是放大了采集图像对人眼的视场角, 更有利于后期的图像判读, 但并不能改变相机的照相分辨率。

3 试验

为了验证光学变焦与缩放算法对照相分辨率的影响, 搭建了一个试验平台, 如图2所示。试验测试系统主要包含四部分:可见光源、标准靶标、准直仪、可变焦面阵CCD相机。可见光源照射在标准靶标图案上, 形成摄影目标, 试验中选用四条形靶, 一条亮条纹或一条暗条纹的宽度为0.3 mm;准直仪用光学方法将目标置于无穷远处, 本次试验选用的准直仪焦距为1 500 mm;镜头焦距在50~200 mm范围内可调;选用面阵CCD相机作为接收元件, 其中像元尺寸为13μm×13μm。根据第一节的论述, 当焦距为50 mm时, 单个亮条纹或暗条纹在像面上对应的宽度为10μm;当焦距为100 mm时, 对应的宽度为20μm。

图3给出了当光学焦距为50 mm, 获取的靶标图像, 图4为光学焦距为100 mm时获取的靶标图像。从中可明显发现, 焦距增加一倍, 空间采样频率提高一倍, 从而使靶标图案的边沿信息更加丰富, 但同时由于相对孔径的减少, 图4的亮度有所降低。对50 mm焦距靶标图案采用最邻域插值, 线性插值、双三次插值算法放大一倍, 如图5、6、7所示, 虽然靶标图像放大了一倍, 与100 mm焦距采集的图像大小一致, 但由于欠采样的原因, 边沿信息明显模糊, 分辨率并没有提高。

4 结论

针对光学变焦与缩放算法对图像分辨率有什么影响, 本质上有何区别这一问题, 本文从采样理论出发, 将光学变焦与图像缩放结合起来分析, 在理论上深入讨论了二者之间的联系与区别, 并搭建起了分辨率测试平台, 试验验证了变焦距与缩放算法对分辨率的影响。本文的分析与试验希望对相机的设计与应用技术人员提供一点启发, 从而更深入的理解与运用这两种方法。

摘要：为了研究光学变焦与缩放算法对图像分辨率的影响, 首先深入论述了三种分辨率定义, 即光学镜头分辨率、探测器分辨率、摄影分辨率, 然后了从采样理论出发分别分析了光学变焦与缩放算法对图像分辨率的影响与二者之间的区别。最后搭建了分辨率测试系统, 获取了变焦距与缩放算法的靶标图像。实验结果表明, 100mm焦距的靶标图像边沿清晰、分辨率高, 而经缩放算法放大一倍的50mm焦距靶标图像边沿模糊, 分辨率下降。

关键词：光学变焦,缩放算法,分辨率

参考文献

[1]王德江, 张涛, 匡海鹏, 等.陀螺关键参数的标定及对航空相机伺服控制系统的影响[J].光电工程, 2010, 37 (1) :43-48.WANG De-jiang, ZHANG Tao, KUANG Hai-peng, et al.Calibration of Gyro’s Key Parameters and Their Effect on Aerial Camera’s Servo Control System[J].Opto-Electronic Engineering, 2010, 37 (1) :43-48.

[2]Smith W J.Modern Optical Engineering[M].New York:McGraw-Hill, Inc, 2000.

[3]Eehmann Thomas M.Survey:Interpolation Methods In Medical Image Processing[J].IEEE Transaction on Medical Imaging (S0278-0062) , 1999, 18 (11) :1049-1075.

[4]Xin L, Orchard M T.New Edge-Directed Interpolation[J].IEEE Transaction on Image Processing (S1057-7149) , 2001, 10 (10) :1521-1527.

[5]Saif Zahir, Rabab Ward.A New Edge Preserving Binary Images Resizing Technique[J].Journal of Circuits, Systems, and Computers (S1793-6454) , 2002, 11 (3) :247-257.

[6]Holst G C.CCD Array, Cameras and Displays[M].Bellingham:SPIE Optical Engineering Press, 1996.

[7]曹琦, 王德江, 张齐, 等.红外点目标的能量积累[J].光学精密工程, 2010, 18 (3) :741-747.CAO Qi, WANG De-jiang, ZHANG Qi, et al.Energy Accumulation in Infrared Point Target Detection[J].Optics and Precision Engineering, 2010, 18 (3) :741-747.

[8]刘妍妍, 张新, 徐正平, 等.利用异型像元探测器提高空间分辨率[J].光学精密工程, 2009, 17 (10) :2620-2627.LIU Yan-yan, ZHANG Xin, XU Zheng-ping, et al.Enhancing spatial-resolution with detectors of special-shaped pixels[J].Optics and Precision Engineering, 2009, 17 (10) :2620-2627.

图像缩放篇5

在现行电视系统中,幅型比4∶3与16∶9两种格式的视频图像素材同时存在。为把原有4∶3格式的素材用到新的电视系统中或把新的16∶9格式素材用到传统电视系统中,均需进行视频图像幅型比的转换处理。贴黑边处理不损失原图像的内容,没有变形失真,但屏幕没有充分利用;裁剪处理没有变形失真,但损失了部分图像内容;线性缩放处理使原图像的内容和显示区域得到全部利用,但图像会出现变形失真[1,2,3]。

对于电视的一帧图像而言,主景在中间部位,是观众关注的重点;相对而言,两侧的图像显得次要一些。若能对图像的主景部位进行线性变化,对两侧的图像进行非线性变化,既可保证主景图像的不失真和内容的完整性,又可利用全部显示区域,达到较完美的视觉效果。据此,本文提出了一种基于可变区域的视频图像幅型非线性缩放算法。

2 算法实现原理

可变区域的视频图像幅型非线性缩放算法实现原理如图1所示。

将图像分为中间线性变换区域和两侧非线性变换区域,通常将线性区域和非线性区域的大小固定,如两侧非线性区域(Left,Right)各占30%,中间线性区域(Center)占40%,固定线性区域和非线性区域的大小可简化电路设计。由于非线性缩放的效果主要由用户的主观评价,不同国家与地区的用户对缩放效果的要求与评价并不一样。针对这一情况,提出一种可变区域的非线性缩放,可变区域是指线性区域和非线性区域的大小可通过软件设定,在产品设计阶段,根据特定人群对缩放效果的反馈,选出比较理想的数值进行区域设定。

3 算法实现

可变区域全景视频图像幅型非线性缩放控制器硬件设计如图2所示。核心采用两个累加器,一个用来做非线性累加器(NL),一个用来做缩放系数值累加器(SV)。

可变区域的线性区域缩放比例主要由信号格式和显示屏幕的尺寸决定,非线性缩放的效果取决于非线性区域的大小、线性区域的大小、非线性缩放函数的特性和线性缩放比例K。left,center,right分别表示缩放后图像的左侧非线性区域、中间线性区域和右侧非线性区域的大小。一般情况下,取left=right。若用WDISP表示显示屏幕的宽度,则

非线性区域的缩放可选择不同的非线性函数,函数的选择主要考虑电路设计的复杂度,同时应满足以下条件:缩放函数初始值不小于零;函数的斜率应线性变化,,在线性区域和非线性区域的交界处,其斜率递减为零,其函数值等于线性缩放比例K;缩放电路只能对所有区域进行放大或缩小,若K>1,则整条曲线都位于1之上,若K<1,则整条曲线都位于1之下。为了使电路设计简单,,笔者选用二次函数作为非线性缩放函数

二次函数的系数和线性缩放比例K由输入信号格式、显示格式和非线性区域的大小(left)决定。输入信号格式包括输入图像的幅型比、输入像素的幅型比、输入图像的宽度WSRC和高度HSRC,由图2中的图像格式甄别器根据输入视频图像场的数据得到,并将识别结果送给图2中的CPU控制器。显示格式包括显示屏幕的幅型比、屏幕像素的幅型比、屏幕的宽度WDISP和高度HDISP,这些参数由图2中的参数设置软件向CPU控制器进行设置,这里WSRC,HSRC,WDISP和HDISP均以像素计。在输入信号格式和显示屏幕给定的情况下,可变的参数只有left。CPU控制器根据图像格式甄别器送来的输入信号格式、参数软件设置的显示格式和非线性区域的大小(left)来计算出二次函数的系数和线性缩放比例K,并将计算结果送到图2中的NL和SV进行设置。

4 算法仿真结果分析

如图3所示,有一输入幅型比为4∶3,图像格式为720×480的视频素材,需要输出到幅型比16∶9格式1 920×1 080的HDTV上显示。

采用全景线性缩放变换后幅型比16∶9格式1 920×1 080图像如图4所示,从图中可以看出,整幅图像出现变形失真。

当left=750,采用非线性缩放算法缩放后,幅型比16∶9,格式1 920×1 080,图像效果如图5所示。当left=780,采用非线性缩放算法缩放后,幅型比16∶9,格式1 920×1 080,图像效果如图6所示。

从非线性缩放后的图像可看出,线性区域没有变形失真,即主景图像没有变形失真,同时维护了图像内容的完整性,也充分利用了屏幕的全部显示区,达到一种较完美的显示效果。但从图5和图6可看出,非线性区域的变形失真比线性缩放后的图像严重,与图6相比,图5没有变形失真的区域更大,但两侧变形失真更为严重,在实际应用中可以选择多组参数,对缩放效果进行对比,选出比较理想的数值进行非线性区域设定。

摘要：详细讨论了算法的原理和工程实现方法。结果表明,该算法既可保证主景图像不失真及图像内容的完整性,又可充分利用电视屏幕的整个显示区,达到较完美的视觉效果。

关键词：视频图像,幅型变换,非线性缩放算法,可变区域

参考文献

[1]王联,杨庆华.4:3和16:9幅型比在HDTV/SDTV节目制作和播出系统中的处理[J].现代电视技术,2002(9):37-39.

[2]许志祥.高清与标清制式转换及其实现[J].电视技术,2002(7):12-16.

【图像缩放】推荐阅读：

特征缩放06-06

缩放算法07-31

摄影图像07-16

扫描图像07-19

符号图像07-20

图像研究07-21