视觉质量

2024-09-19

视觉质量（精选11篇）

视觉质量篇1

0引言

新疆是我国最大的优质葡萄生产地区, 气候温和干燥, 昼夜温差大且日照充足, 非常适宜栽培葡萄, 无核白葡萄是新疆主要品牌产品之一。无核白葡萄又名无籽露, 无籽、味甘甜, 是鲜食、制干、制罐的兼用型品种, 因此进行无核白葡萄的品质检测成为提高其产后价格竞争力的有效方法之一。但是, 该地区果品的采后处理比较落后。由于鲜葡萄果皮薄、多汁、易受损, 采用传统的人工视觉分级, 不仅破坏葡萄的外部品质, 同时受主观因素影响, 不能很好地将葡萄有效鉴别出来, 从而不利于葡萄采摘后的标准化、市场化生产。随着自动化技术的不断提高, 基于机器视觉的图像处理技术成为有效实现鲜葡萄的快速无损检测主要技术手段之一。

目前, 对鲜葡萄品质检测主要是基于机器视觉技术的外部品质检测, 国内外学者已取得一定进展。主要研究有: 田锐等[1]采用机器视觉技术对葡萄穗的颜色进行检测, 检测紫色、红色葡萄的准确率接近90%曾庆兵等[2]采用机器视觉技术对重叠葡萄的果实直径进行检测, 采用对象标记以及分水岭变换法来分割图像, 测量的重复精度可达 ± 9μm; 陈英等[3]采用机器视觉技术对葡萄穗的颜色和形状进行检测, 采用基于RGB颜色空间进行颜色分级, 采用投影面积法及果轴方向投影曲线方法提取果穗形状, 颜色和大小形状分级的准确率分别为90% 和88. 3% 。王巧华等[4]发明了一种基于机器视觉的红提葡萄自动分级装置及其办法, 此发明通过提取RGB分量直方图、计算曲率角、计算突变点等方法提取葡萄的颜色特征和大小。该分级装置对颜色判断准确率达96% , 大小判断正确率为85% 。Qingbing Zeng等[5]提出了一种在葡萄地可无触摸精确测量葡萄直径的光学方法, 采用双滤波器对灰度图像进行平滑, 可有效滤除噪声, 很好地保留原始图像的边界, 采用大津法阈值分割法获得分割图像, 对葡萄直径的检测可达到0. 7mm的重复精度。 Esteban Vazquez - Fernandez等[6]设计了一种基于机器视觉技术的葡萄自动检测和分级的系统, 采用基于HSV颜色空间的V平面高斯滤波的方法对光照度进行分配, 使光照在较广的范围内保持不变, 从而可获得葡萄的平滑图像; 其次采用Gabor滤波器进行图像分割, 然后采用人工神经网络方法和随机森林算法进行葡萄的分级, 准确率达94% 。可见, 目前对鲜葡萄的检测主要是基于颜色和形状大小特征, 其中基于颜色特征的分级准确率较高, 但是基于葡萄形状、颗粒大小和质量等特征的分级准确率较低。为此, 针对新疆无核白鲜葡萄, 采用机器视觉技术进行鲜葡萄穗质量预测, 从RGB图像中找到合适分割的分量或分量运算图像, 分析优选特征组合来预测其质量。

1材料与方法

1. 1材料

试验用样本均为从乌鲁木齐北园春水果批发市场购买的新鲜葡萄, 品种为无核白, 选取35串葡萄进行试验, 样本随机选取, 获得葡萄的外部特征信息。全部样本按3∶ 1比例随机分成建模集和预测集, 分别为26串和9串。

1. 2仪器设备

试验使用加拿大DALSA彩色三线阵CCD摄像机, 相机放于以白色遮光板为挡板的密闭光源箱内。光源分别为科视自动化BL - 170 - 30 - W型LED灯和奥普特自动化OPT - LS562 - W型LED灯, 设置高度分别为20, 24cm, 角度分别为45°, 30°, 使摄像机能够充分吸收光源的光照, 达到拍摄时所需的最佳光照度。光源箱架于传送台上, 以便实现葡萄图像的在线采集。图像分析软件为Mat Lab R2008a。

1. 3图像采集

图像采集前进行设备调试, 确定最佳参数, 避免图像失真。首先, 需要调整摄像机的位置, 获得最佳工作距离为480mm; 调整相机的曝光时间为620ms; 调整行频为685, 使图像空间分辨率中水平分辨率与垂直分辨率相等, 其分辨率为2 048 /34 = 6. 0mm /pixel; 矫正相机的明场、暗场, 从而获得均匀光线; 背景选用白色卡纸, 便于背景图像分割。将葡萄穗水平放于输送带上, 果梗朝统一方向水平放置, 图像拍摄过程中每翻转120°拍摄1幅图片, 共105幅图片用于图像分析及特征提取。

1. 4方法

1. 4. 1图像预处理

提取RGB图像, 做G, B双通道分量加运算R + B, 如图1所示。对比无核白葡萄的R, G, B分量直方图以及G + B组合分量直方图可以看出: 直方图均表现为明显的双峰, 其中G + B分量直方图波峰波谷较明显且宽度较大, 优于R, G, B单分量直方图, 因此选用无核白葡萄G + B分量进行图像分析。此外, 采用传统的RGB图像转灰度图像、单分量图像和分量运算图像, 然后采用大津阈值分割、自适应阈值分割两种方法。结果表明, 直接转灰度图像和单分量图像和一些分量运算图像, 分割效果不佳; 而选用G + B运算图像分割效果较好。因此, 选择采用G + B运算图像用于后续分析。

采集图像过程中, 由于受到外部和内部干扰, 不可避免地会产生噪声, 增加了图像分割的难度, 本文首先采用3 × 3高斯低通滤波的方法滤除图像中的噪声; 其次采用Gamma变换调整图像灰度级的方法增强图像的灰度, 从而提高前景与背景的对比度。

1. 4. 2图像分割

图像二值化就是将图像上的像素点的灰度值设置为0或255, 即使整个图像呈现出明显的黑白效果。将256个亮度等级的灰度图像通过适当的阈值选取从而获得可以反映图像整体和局部特征的二值化图像。图像的二值化有利于图像的进一步处理, 使图像变得简单, 而且数据量减小, 能凸显出感兴趣的目标的轮廓, 从而有利于目标特征参数的提取。

大津法又称最大类间方差法[7], 由Ostu于1978年提出, 属于自适应阈值选取方法, 具有统计意义上的最佳分割阈值, 尤其适合于背景与目标的直方图具有双峰性质的图像分割。该方法采用类别方差来表征特征, 获得最优阈值T将图像分成A和B两部分。迭代阈值分割同样适用于直方图具有双峰性质的图像, 该方法基于逼近的思想, 根据阈值T将图像分为前景和背景; 但对于直方图双峰不明显, 或图像目标和背景比例差异悬殊, 迭代法所选取的阈值不如最大类间方差法。

图像二值化的关键是阈值的确定, 本文对比大津法和迭代法分割图像的效果获得最优阈值, 利用所得阈值分割图像, 从而获得目标二值图像。进而采用数学形态学算法对图像进行优化, 消除部分阴影区域的影响, 滤除不必要的噪声, 以便获得最优特征参数。

1. 4. 3特征提取及质量预测模型

葡萄穗的质量指标与其图像的几何特征具有一定相关性, 提取二值图像中目标区域的几何特征, 包括面积、周长、长轴和短轴特征来预测葡萄穗的质量。预测分析中, 分别采用单个特征和多种特征组合的方法建立一元线性回归模型、多元线性回归模型以及偏最小二乘回归模型, 对比模型的优劣, 获得预测葡萄穗的质量的较优模型。

2结果与分析

2. 1图像二值化

采用两种方法分割图像结果, 如图2所示。对比图2中两种算法分割无核白葡萄的效果, 可看出用大津法明显优于迭代法。用大津法分割的图像目标与背景间对比度较大, 分割效果更明显, 保留了较多有用图像特征信息, 有利于后续图像处理及目标区域特征的提取。从图2中可看出, 分割后的图像存在部分噪音影响, 可采用数学形态学运算[8]中的腐蚀和开运算进行滤波去噪, 从而获得较清晰的二值图像。

2. 2葡萄的质量预测

葡萄的质量与其面积、周长、密度、含水率等因素有关, 葡萄图像经预处理及二值化分割后的目标区域的面积 ( S) 、周长 ( L) 、长轴 ( A) 和短轴 ( B) 长度特征信息与葡萄的截面积相关, 因此可以选取这些特征参数来预测葡萄穗的质量。其中, 在图像采集过程中葡萄穗每翻转120°拍摄1幅图片, 因此每个角度拍摄的图片面积特征分别用S1, S2, S3表示。首先, 采用单个特征参数预测葡萄穗的质量, 经研究发现, 采用单个面积特征建立的一元线性回归模型可以预测葡萄穗的质量, 并且采用面积特征的预测结果优于其它3个特征; 其次, 基于一串葡萄的多个面积特征建立多元线性回归模型[9]; 再次, 采用面积分别与周长、长轴以及短轴长度相结合的方法建立多元线性回归模型和偏最小二乘回归模型[10]。对比模型的预测结果, 确定最佳预测模型。使用Mat Lab软件进行建模, 所得结果如表1、表2、表3所示。

从表1 ~ 表3中可看出: 无核白葡萄的几何特征与其质量具有相关性, 相关系数r2越接近于1时, 此方程回归性越好。表1中采用第一个面积特征建立的一元线性回归模型相关系数为92. 33% , 优于其它两个面的预测结果。从表2可以看出, 采用多个面积特征建立的多元线性回归模型可以较好预测葡萄穗的质量, 相关系数最高为92. 43% , 预测结果与采用单个面积特征S1的预测结果相差不大, 但是明显优于采用单个面积特征S2, S3的预测结果。从表3可以看出, 基于面积分别与周长、长轴和短轴长度相结合的多个特征建立的多元线性回归模型和偏最小二乘回归模型相关性最低为93. 34% , 均可以很好地预测出葡萄穗的质量, 预测结果明显优于只采用单个面积特征以及多个面积特征相结合的预测结果。同时, 对比该方法建立的多元线性回归及偏最小二乘回归模型的预测结果发现, 采用偏最小二乘回归进行质量预测效果优于多元线性回归模型的预测效果, 相关性最高可达96. 91% 。

预测模型的精确性及稳定性也可由平均相对误差来判定, 误差越小, 表明预测模型的准确性越高。对比表1、表2、表3中预测值与实际值的平均相对误差结果发现, 采用面积与周长、长轴和短轴长度特征建立的偏最小二乘回归模型预测平均相对误差最小, 建模集平均相对误差为9. 19% , 验证集相对误差为10. 57% 。采用该方法对验证集中9串葡萄进行质量预测, 建立预测值与实际值之间的回归模型如图3所示, 实际值与预测值很好地分布于回归线两侧。

3讨论

本研究初步探讨了基于机器视觉技术的新疆无核白葡萄穗的质量预测方法, 研究中采用葡萄穗图像的单个面积特征, 多个面积特征, 面积与周长、长轴以及短轴长度特征相结合方法建立的回归模型进行葡萄穗的质量预测。其中, 面积与周长、长轴以及短轴长度特征相结合方法建立的偏最小二乘回归模型比只采用单个特征建立的一元线性回归模型和多元线性回归模型质量预测的结果要好。先前的研究一般只采用单个特征进行质量预测, 如马本学、应义斌[11]基于机器视觉技术采用库尔勒香梨的侧面投影面积、顶部投影面积以及两个面积相结合的方法预测其质量, 效果显著, 决定系数达97. 5% 。郝敏等[12]利用机器视觉技术, 采用面积法、周长法两个指标对马铃薯的单薯质量进行检测, 同时采用逐步线性回归分析法选择最优几何特征值, 最终确定采用俯视投影面积和侧视投影面积进行预测的结果最好, 相关性达98. 81% 。香梨、马铃薯等水果果形较规则, 不易发生形变, 葡萄穗是由单个颗粒堆叠而成, 果穗的形状随放置的变化而变化, 只采用单一的面积特征无法准确预测葡萄穗的质量, 因此本文采用多个特征参数相结合进行品质预测研究。此外, 水果的在线品质检测及分级对图像采集及分割方法的要求较高, 因此需要较高的外部环境以及合理而且简单的分割算法。由图2可看出, 图片中存在部分阴影噪声, 这是由于光照影响使图片亮度不均匀造成, 给图像分割造成一定困难。因此, 在图像采集阶段硬件设备如光源等需要进一步改进, 同时采用较好的方法滤除噪声。其次由于葡萄穗水平放置在输送带上容易引起穗形变化, 不利于后期图像分析, 因此在后续研究中预期采用葡萄穗悬挂式采集不同投影面的图片, 同时检测葡萄的其它外部品质。本文为葡萄穗群粒的质量预测的初步研究, 后续研究中将增加葡萄单粒的质量检测, 从而进一步提高质量预测的准确性。

4结论

本文方法可有效检测葡萄穗的质量。在图像处理中选择G + B双通道分量进行图像分析, 采用高斯低通滤波法滤除图像中的噪声, 采用gamma变换法增强前景与背景的对比度, 对比自动阈值法和迭代法确定最优阈值分割图像, 最后经数学形态学的腐蚀和开运算优化去噪后获得最佳二值图像, 提取二值图像中目标区域的特征参数。研究发现, 采用面积与周长、长轴长度、短轴长度相结合的方法建立的偏最小二乘回归模型可以很好地预测葡萄穗的质量, 相关性达到96. 91% ; 且采用该方法进行质量预测的误差最小, 建模集平均相对误差为9. 19% , 验证集平均相对误差为10. 57% 。可见, 该技术系统对鲜葡萄穗质量进行检测是可行的。在今后的研究中要增加样本以及样本的广泛性, 进一步完善预测模型, 推动该技术在水果品质检测中的推广和应用。

参考文献

[1]田锐, 郭艳玲.基于机器视觉的葡萄自动识别技术[J].东北林业大学学报, 2008, 36 (11) :95-97.

[2]曾庆兵, 刘成良, 苗玉彬, 等.基于形态学图像处理的重叠葡萄果径无损测量[J].农业工程学报, 2009, 25 (9) :356-360.

[3]陈英, 廖涛, 林初靠, 等.基于计算机视觉的葡萄检测分级系统[J].农业机械学报, 2010, 41 (3) :169-172.

[4]王巧华, 丁幼春, 罗俊, 等.基于机器视觉的红提葡萄分级装置及其方法:中国, CN 102680414 A[P].2012-09-19.

[5]Qingbing Zeng, Chengliang Liu, Yubin Miao, et al.A Machine Vision System for Continuous FieldMeasurement of Grape Fruit Diameter[C]//Second International Symposium on Intelligent Information Technology Application, 2008:1064-1068.

[6]EstebanVazquez-Fernandez, AngelDacal-NietoFernando, Martin, et al.A Computer Vision System for Visual Grape Grading in Wine Cellars[J].ICVS, 2009:335-344.

[7]Carsten Steger, Markus Ulrich, Christian Wiedemann.机器视觉的算法与应用[M].杨少荣, 译.北京:清华大学出版社, 2008.

[8]Rafael C Gonzalez, Richard E Woods, Steven L Eddins.数字图像处理 (MATLAB版) [M].阮秋琦, 译.北京:电子工业出版社, 2005.

[9]程国首, 郭俊先, 石砦, 等.基于高光谱图像技术的新疆红富士苹果重量预测[J].新疆农业大学学报, 2011, 34 (3) :1-2.

[10]郭俊先, 李俊伟, 胡光辉, 等.新疆冰糖心红富士苹果RGB图像多指标分析[J].新疆农业科学, 2013, 50 (3) :509-517.

[11]马本学, 应义斌.基于图像处理和光谱分析技术的水果品质快速无损检测方法研究[D].杭州:浙江大学, 2009.

[12]郝敏, 麻硕士.基于机器视觉的马铃薯单薯质量检测技术研究[J].农机化研究, 2009, 31 (9) :61-63.

视觉质量篇2

早期的水利工程质量检测大部分都是依靠人力进行的，也就是派遣大量专家到实地进行考察和测量，虽然准确性有所保障，但测量结果往往会受到检测人员主观因素的影响。随着计算机技术和图像处理技术的不断发展，人力检测方式也逐渐被智能化的检测算法所取代，常见的智能化水利工程质量检测算法主要有三种：即以小波变换为基础的检测算法、以像素差值为基础的检验算法以及以数理统计为基础的检验算法。

智能化水利工程质量检测算法的运用，大大提高了水利工程质量检测的效率，也极大地节省了人力和财力。但是，传统的智能化水利工程质量检测算法却存在一个非常致命的问题，就是因为视觉图像是水利工程质量检测的基础，而视觉图像大部分都是依靠飞行器进行远程采集的，采集图像的过程中很容易受到飞行器震动颠簸和天气因素等外界因素的干扰，进而导致像素过低，或者有价值的关键特征缺失。这些问题都影响了视觉图像的清晰度，并最终降低水利工程质量检测的准确率，甚至无法进行水利工程质量检测。新型水利工程质量检测算法的提出

为了解决上述问题和缺陷，提出了一种新型的水利工程质量检测算法，也就是以误差补偿神经网络数学模型为基础的水利工程质量检测算法，其具体检测流程可以分为以下几个步骤：第一步是对水利工程相关图像进行采集；第二步是通过小波变换来对图像进行初始化的处理，主要是把图像中的噪声去除，进而提高图像的清晰度；第三步是通过误差补偿神经网络算法模型的建立，来对待测区域是否存在误差进行判断；第四步是运用方差来把检测过程中的误差和衡量标准作对比，并通过误差补偿来补偿误差。

总而言之，这种新型水利工程质量检测算法可以有效避免关键特点和细节的缺失，进而提高水利工程质量检测的准确率。关于水利工程质量检测的原理阐述

目前而言，对水利工程质量影响较大的主要是洞穴等生物留下的痕迹，这些都会造成水利工程的潜在危机，而通过远程监测系统和雷达图像像素灰度值差值算法，可以对这些潜在的质量问题加以检测，进而提早处理。

水利工程质量检测的原理主要包括以下几点：①在待测区域安装机载图像采集设备，从而对相关图像进行采集；②对采集到的图像进行初始化处理，因为原始图像多为远程图像，不但图像清晰度相对较差，图像质量也难以保证，所以必须通过灰度处理算法来对图像进行处理，即通过一定的公式获得新的灰度值，来对初始灰度值加以替换，一方面有助于图像质量的提升，另一方面也可以帮助获得更多相关的信息，进而为检测准确率的保证提供数据基础；③对处理后的图像进行像素灰度差值的计算，并且与衡量标准相对比，如果像素差值比衡量标准大，那么就说明待测区域内存在部分质量隐患；如果像素差值比衡量标准小，那么就说明待测区域完全安全，不存在任何质量隐患；这种水利工程检测算法由于图像像素关键细节和特征难以保证，因此会出现像素差值不准确，进而影响检测结果的准确性。基于视觉图像的水利工程质量检测

基于视觉图像的水利工程质量检测算法，实际上是在对图像进行预处理之后，通过建立模型、以及检测和补偿误差等步骤的运算，来对人脑和人眼的功能进行模拟，进而判断水利工程质量好坏的过程。基于视觉图像的水利工程质量检测算法主要分为以下几步：

（1）对图像进行初始化处理：在获取远程采集的原始水利图像之后，应当对其进行图像预处理，从而获得与之有关的像素参数，并且运用噪声频率阀值来去除原始图像中的噪声，同时对原始图像中所有的有效信息做到最大程度的保留。通过对图像的初始化处理，可以在保留初始图像有效信息的基础上，进一步提高图像质量和清晰度，进而为水利工程质量检测提供准确的数据基础。

（2）建立神经网络数学模型：对待测水利工程质量的归属和类别进行判断，是水利工程质量检测的最终目的，也就是说，通过水利工程质量检测，来判断待测区域的质量是否合格。因此，在建立神经网络数学模型时，必须输入初始化处理之后的图像相关参数和数据，而输出结果分为1 和0，前者代表水利工程质量良好，不存在质量问题；后者则代表水利工程存在质量问题。

（3）检验误差：检验误差是对误差进行补偿的前提和基础，通过误差检验，可以判断水利工程质量检测的误差和衡量标准是否相符，以为误差补偿提供数据支持。通过一系列公式，可以获取水利工程质量检测系数，并将检测系数与衡量标准相对比，如果获取的检测系数比衡量标准小，那么说明水利工程质量的检测误差在允许范围之内，无须进行补偿；如果获取的检测系数比衡量标准大，那么说明水利工程质量的检测误差已经超出允许范围，必须通过误差补偿算法对误差进行有效补偿。

（4）误差补偿：误差补偿主要是通过共轭梯度算法完成的，即通过对平移系数梯度、伸缩系数梯度和权值系数梯度的计算，对误差补偿进行计算，这种算法有利不与地面接触。一般情况下，还应当将照明开关安装在门框旁边，两者相距要在0。2m 左右，距离地面要在1。3m 左右。而对于壁扇则要求其下侧距离地面的高度大于1。8m。接地装置安装

在进行接地装置安全前要进行接地装置的电阻测量，当电阻值满足标准时才能够进行安装。另外，如果没有设计要求，则要保证接地装置的埋设深度不大于0。6m。同时确保各接地装置之间的间距满足相关要求。根据相关规范：如果扁钢与扁钢搭接为扁钢宽度的2 倍，则至少要进行三面的焊接。如果为圆钢的6 倍，则需要进行双面焊接。另外，圆钢与圆钢搭接为圆钢直接6 倍时也要进行双面焊接。此外，连接明配线的地下线部分，要保证其相互之间的间距均匀，水平方向的标准是在1m 左右，垂直方向的标准是2m 左右，弯曲部分的标准是在0。4m左右。施工人员要按照相关施工标准进行接地装置安装，以保证电气工程的质量。无论是对于哪部分的工程进行施工，施工人员都要进行按照相关要求和标准进行施工，从而真正提高施工企业的核心竞争力。结束语

视觉质量篇3

关键词：人眼视觉特性；JPEG；主观评价

中图分类号： TNl4l；TN949 文献标识码： A 文章编号： 1673-1069（2016）31-168-4

1 课题研究的背景和意义

图像是人类感知和机器模式识别的重要信息源，其质量对所获取信息的准确性起着决定性的作用。随着信息化社会的到来以及信息高速公路的实施，各行各业对图像的使用越来越广泛，人们对图像质量的需求也越来越高。经过压缩的图像虽然为图像的存储和传输带来了极大的方便，但图像质量有时却不尽如人意，对于彩色图像而言，压缩后图像的颜色损伤是普遍存在的，但人眼对不同颜色的灵敏度不同，因此不同颜色的损伤对图像质量的影响也各不相同。

颜色损伤对视觉感知图像质量的影响研究对数字电视、多媒体数据库、电子图书馆、卫星遥感图像等方面提供了有力的支持。目前针对图像质量评价的算法，国内外的一些知名高校和科研机构，如复旦大学、中国空间技术研究院、VQEG（国际电信联盟的视频质量专家小组）、美国Sarnoff公司等，都对其进行了长期深入的研究。

图像质量评价的主体是人，因此人眼视觉特性（HSV）对评价算法的研究具有重要意义。但是，对人眼视觉特性的研究涉及生理、心理等方面，特别是对视觉的心理特性业界迄今仍难以找出定量的描述方法，所以目前还没有一套全面的、统一的图像质量评价体系。

图像质量评价的方法有两种：①主观评价方法：设计实验，由观测者对图像质量进行评价；②客观评价方法：采用算法对图像质量进行评价。其中主观评价方法天然地和人的主观感受相符，但它费时、复杂，还会受到观测者专业背景、心理和动机等主观因素的影响，并且不能结合到其他算法中使用；客观评价方法方便、快捷，容易实现并能结合到应用系统中，但它和人的主观感受有出入。通常提到的图像质量评价算法是指客观评价算法，其目标是获得与主观评价结果相一致的客观评价值。

2 人眼视觉特性

由于压缩后的图像最终是供大众欣赏和使用的，所以在设定图像压缩的有关参数时都需根据人眼的视觉特性来选择，以使得压缩后的图像质量能满足人眼的要求。人眼视觉特性大致包括视敏特性、亮度感觉特性、视觉分辨力特性和彩色感觉特性等[1]。

2.1 视敏特性

人眼所能感觉的光（可见光）是波长范围为380～780mm的电磁波。实验证明，对于不同颜色的光，人眼不仅有不同的颜色感觉，而且有不同的灵敏度，即对于辐射功率相同而波长不同的光有不同的光亮感觉，人眼的这一特性称为视敏特性。研究表明：在明亮环境中，人眼对波长为555nm的黄绿光有最大的敏感度；在黑暗环境中，人眼对波长为507nm的青绿光有最大的敏感度。

2.2 亮度感觉特性

人眼的亮度感觉是一个主观量，它不仅取决于景物给出的亮度值，而且还与周围环境的平均亮度，即人眼的适应性有关。在平均亮度适中时，人眼能同时感觉的亮度上、下限之比最大可接近1000：1，而平均亮度过高或过低时只有10：1。

2.3 人眼的分辨力

人眼分辨图像细节的能力称为人眼的分辨力或视觉锐度。分辨力除因人而异外，还与景物的照度、景物的对比度等因素有关。当照度太低时，分辨力就大为降低，且分辨不出颜色。相反，当照度太高时，分辨力也不会再增加，甚至由于“眩目”现象而降低。景物细节的对比度低，分辨力也要降低。除此之外，分辨力还与景物的运动速度有关，运动速度快，分辨力将降低。

2.4 人眼的颜色感觉特性

为确切表示某一颜色光，必须有三个独立的参量：亮度（亦称明度）、色调和饱和度（亦称纯度），它们称为彩色的三要素。

2.4.1 亮度

亮度表征色光对人眼刺激程度的强弱，即引起明亮感觉的程度，它与进入人眼色光的光能有关。对于发光物体（光源），发光强度越高，人眼感到越亮；而对于非发光物体，其亮度取决于反射（或透射）的光能大小，照射光源的光能越大，物体表面对光的反射率越高，物体的亮度就越高。

2.4.2 色调

色调表征彩色之间的差异性，反映颜色的类别。理论上讲，在可见光谱中不同波长的光有不同的色调，即应有无数种色调与波长相对应。但实际上对波长很接近的谱色光，人眼并不能区别开它们的色调。从总体上看，在可见光的波长范围内，人眼大体能分辨出200来种不同的色调。当颜色太淡或亮度太大及太小时，人眼对色调的分辨力也会下降。

2.4.3 饱和度

饱和度是指彩色光所呈现彩色的深浅程度（或浓度），即某色调的浓淡、深浅程度或掺白程度，以百分比（%）表示。对于同一色调的彩色光，饱和度越高，说明它的颜色越深；饱和度越低，说明它呈现的颜色越浅。

3 主观评价

主观评价是直接利用观察者对被测系统质量的主观反映，来确定系统性能的一种方法。国外的一篇论文[2]在这一方面进行了首次探索，呈现了一个颜色损伤对视觉感知高分辨率静止图像质量影响的主观研究。本次主观评价实验严格按照主观实验评价标准进行，请若干名实验员在主观评价实验室中进行实验，分别进行彩色图像和黑白图像的主观评价，为原始图像和不同压缩倍数的压缩图像进行打分。将实验所得数据进行分析整理，得出相关结论。

3.1 主观评价设计方案

3.1.1 测试依据

ITU-R BT.500-11[3] METHODOLOGY FOR THE SUBJECTIVE ASSESSMENT OF THE QUALITY OF TELEVISION PICTURES

GY/T 134-1998[4]数字电视图像质量主观评价方法

3.1.2 评价用测试图像序列（见表1）

3.1.3 评价方法

测试分为彩色和黑白两个部分，每个部分有七组图像，每组有6张，为同一内容的2张原始图像和4张压缩图像，每组的第1张为已知的原始图像，其余5张是随机排列的压缩图像和原始图像，测试人员为这5张图像打分，主观评价经JPEG压缩后的图像质量相对于原图像的质量损伤情况。满分为100分。评分规则为：

与原图无可察觉的差别，定为100—80分；

与原图有刚可察觉的差别，不讨厌，定为80—60分；

与原图有差别，稍有讨厌，定为60—40分；

与原图有明显差别，讨厌，定为40—20分；

与原图有明显差别，非常讨厌，定为20—0分。

3.1.4 观看条件

主观评价在中国传媒大学主观评价实验室中进行，其评价观看条件基本符合行业标准GY/T 134-1998中的规定。具体观看条件为：测试人员观看距离约为30cm；室内环境光照明强度低；测试人员的座位在图像水平方向中垂线±30°内。

3.1.5 评价人员

本次测试邀请非专业评价人员14人，均来自中国传媒大学。评价人员年龄在22～27岁之间，其中男性3人，女性8人。

3.1.6 评价用仪器设备

PC机一台，高清监视器（1920*1080）一台

3.2 主观评价实验数据

根据ITU-R BT.500-11和GY/T 134-1998对原始数据进行了筛选，在11人数据中保留了11人，原始图像默认为100分，各个图像的得分情况详见下表，其中置信区间为95%置信度的区间。

3.2.1 彩色图像评价部分（见表2）

3.2.2 黑白图像评价部分（见表3）

需要说明的是，在以上的实验数据中，由于原始图像夹杂在压缩图像中，人眼有时难以分辨出来，因此会与理论上的100分存在一些偏差。但随着图像压缩倍数的增加，人眼可以明显分辨出图像质量的下降。总体上不难看出，受压缩倍数损伤影响较小的是“黄叶和绿地”，受压缩倍数损伤影响较大的是“绿叶”。

3.2.3 主观评价实验结论

各压缩倍数下测试图像的主观评价平均分如图1、图2所示。

每幅测试图像的质量下降总平均分如图3所示。

分析测试得到的数据显示，对于彩色图片来说，人眼对绿色的损伤最敏感，因为随着压缩倍数的增加，绿色的色调会发生显著变化，图像的纹理越细、细节越多，人眼越难发觉图像的变化；对于黑白图像来说，人眼对图像损伤的灵敏度只和图像细节相关，细节越少越灵敏。

4 结论

颜色损伤对视觉感知图像质量的影响研究是一个非常有前途的研究方向，它综合了多种学科，将图像处理、图像理解、人眼视觉等多个领域的研究成果结合起来，具有优质广泛的应用前景。如版权保护、公安系统、数字图书馆、医学等领域。从兴起到现在虽然只有短短的几年时间，但也有了长足的进步，不过由于图像特征描述和人眼视觉特性的复杂性，其技术仍不成熟，理论上还有很多问题有待解决。本文在前人的基础上主要做了如下工作：

本文在前人的基础上研究了基于人眼视觉特性的图像质量评价方法。主观评价方案参照国外的研究方法，并在此基础上针对本课题的研究方向进行了改进。测试图像经过多次筛选，原始图像和压缩图像之间的差异很小，并且原始图像和压缩图像随机排列，每组顺序各不相同，极大地利用了测试者的整体主观感受能力。此外，主观评价数据的整理和分析参照了ITU-R BT.500-11 标准，从而提高了主观评价实验结论整体的准确性。

鉴于有限的时间和作者自身的程度，研究方法也存在一些不足。对本课题的研究还处在刚刚兴起的阶段，随着压缩算法的不断创新和完善，基于人眼视觉特性的图像质量评价还有很大的研究空间，许多方法仍值得深入研究。

参考文献

[1] 姜秀华.现代电视原理[M].北京：高等教育出版社，2008.

[2] Francesca De Simonea， Frederic Dufauxa， Touradj Ebrahimia， Cristina Delogub， Vittorio Baroncinib A Subjective Study Of The Influence Of Color Information On Visual Quality Assessment Of High Resolution Pictures aEcole Polytechnique Fédérale de Lausanne （EPFL）， CH-1015 Lausanne， Switzerland bFondazione Ugo Bordoni （FUB）， Via Baldassarre Castiglione 59， 00142 Rome， Italy.

[3] ITU-R BT.500-11 METHODOLOGY FOR THE SUBJECTIVE ASSESSMENT OF THE QUALITY OF TELEVISION PICTURES.

视觉质量篇4

1 资料与方法

1.1 一般资料

随机选取于我院行角膜屈光手术术前检查的健康青年中患有低、中度近视、高度近视患者和正视眼成人, 共93例, 均选择右眼为研究对象 (93眼) , 其中, 男41例, 女52例;年龄为18~30岁, 平均 (24.32±3.58) 岁;SE为-0.25~-9 D, 平均为 (-3.65±2.67) D。所有受试者均由同一名具有丰富经验的验光师进行验光。本次研究中, 近视定义为球镜度<-0.50 D者[8]。按球镜屈光度 (spherical equivalent refraction, SE) 将所有患者分为四组:正视眼组 (19眼, +0.50 D>SE≥-0.50 D) , 低度近视眼组 (26眼, -0.50 D>SE≥-3 D) , 中度近视眼组 (27眼, -3 D>SE≥-6 D) , 高度近视眼组 (21眼, SE<-6 D) 。所有受试者均符合以下条件: (1) 年龄为18~30岁; (2) 球镜度数为+0.50~-9 D, 柱镜度数为+0.5~-0.5 D; (3) 最佳矫正视力 (BCVA) ≥1.0; (4) 无配戴角膜接触镜史。所有受试者均经过裂隙灯、眼底镜等眼科检查, 除近视外, 无其他任何眼部疾病, 无眼部手术史, 无任何系统性疾病。所有受试者检查前均已签署知情同意书。

1.2 视觉质量参数的测量

本研究用OQAS测量人工瞳孔直径为4.0 mm时的视觉质量参数:调制传递函数截止频率 (modulation transfer function cutoff frequency, MTFcutoff) 、斯特列尔比 (Strehl ratio, SR) 、客观散射指数 (objective scatter index, OSI) 、对比度为100%时的OQAS值 (OV100%) 、对比度为20%时的OQAS值 (OV20%) 、对比度为9%时的OQAS值 (OV9%) 。所有的测量过程均由同一名经验丰富的医师完成。在测量过程中, 先测量右眼, 连续测3次, 取各个参数的平均值。在测量期间, 部分球镜屈光度和柱镜屈光度由OQAS内置视力计自动矫正。OQAS内置视力计矫正球镜屈光度的范围为-8.00~+6.00 D。本次研究中, 超过-8.00 D的高度近视使用外置镜片矫正后再进行视觉质量测量。在测量时, 室内保持低照明度, 使瞳孔直径自然放大至大于4.0 mm。

OQAS可测量多种视觉质量参数, 不同的视觉质量参数所代表的意义不同。OQAS以波长为780 nm的近红外光作为点光源, 可记录采集该点光源在视网膜上的像。通过采集得到的视网膜成像, 可计算MTF。MTF代表了不同空间频率处像与物对比度之间的差异, 即视网膜上所成像与实际物的对比度比值, 反映光学因素对视网膜成像质量的影响。为了方便临床应用, OQAS提供了几种较简便的与MTF相关的参数来客观评估视觉质量:MTFcutoff、SR、OV100%、OV20%、0V9%。在OQAS中, MTFcutoff是指在MTF曲线上, MTF值为0.01时所对应的空间频率, 此时趋向于分辨率极限。SR是指被测眼与理想无像差眼的MTF曲线下面积之比[9]。OV100%、OV20%、OV9%分别代表对比度为100%、20%、9%条件下的视觉质量, 模拟测定不同环境下的视觉表现。OV100%是MTFcutoff除以30周/度所得。OV20%即0.05 MTF值除以30周/度所得。OV9%即0.01 MTF值除以30周/度所得。MTFcutoff、SR、OV100%、OV20%、0V9%值越高, 说明视觉质量越好。此外, OQAS采用OSI来量化眼内散射程度。OSI是双通道影像外周 (12~20弧分) 与中心 (1弧分) 的光能量之比。OSI介于0至10之间, OSI值越高, 表示眼内散射越严重[10]。

OQAS以波长780 nm的近红外光为光源。780 nm近红外光既安全又轻度可见, 从而可提高被检测者的舒适度和配合度;且近红外光作为光源所测得的视网膜图像质量与用可见光获得的视网膜图像质量一致[11]。但由于近红外光的可见性较低, 在测量视力较差眼的视觉质量时, 患者的配合度下降, 可导致视觉质量测量结果的一致性较低[12]。

本次研究的对象均为BCVA≥1.0的青年人, 配合度好, 因此本研究中的视觉质量测量结果不存在上述问题, 具有较高的参考价值。

1.3 统计学方法

随机、对照、横断面研究。用SPSS17.0统计学软件进行数据分析, 数据用±s表示。各项视觉质量参数分别经正态性检验和方差齐性检验, 均满足正态分布和方差齐性。应用单因素方差分析, 对低、中度近视和正视眼三组之间视觉质量参数进行比较。应用Pearson相关分析, 分析视觉质量参数与年龄、SE的相关性, 以P<0.05表示差异具有统计学意义。

2 结果

2.1 四组受试者的视觉质量参数比较

正视组、低度近视组、中度近视组三组间各个视觉质量参数差异不具有统计学意义 (P>0.05) 。高度近视组的MTFcutoff、SR、OV100%、OV20%、OV9%值均明显小于正视组、低度近视组和中度近视组 (P<0.05) 。高度近视组OSI值明显大于正视组、低度近视组和中度近视组 (P<0.05) , 具体数据见表1。

注:与正视组比较, *P<0.05;与低度近视组比较, #P<0.05;与中度近视组比较, △P<0.05。

2.2 视觉质量参数与年龄、SE的相关性

Pearson相关性分析结果显示, MTFcutoff、SR、OSI、OV100%、OV20%、OV9%与年龄间均无相关性 (P>0.05) ;MTFcutoff、SR、OV100%、OV20%、OV9%与SE之间呈正相关性, OSI与SE之间呈负相关性 (P<0.01) , 见表2。

3 讨论

近视作为最常见的眼病之一, 严重影响着人们的视觉健康。近年来, 我国近视患病率高, 并呈不断增长的趋势。据相关文献报道, 我国高中生近视的发病率已高达80.7%, 大学生近视的患病率为95.5%[13]。可见, 研究与比较近视对健康青年视觉质量的影响, 具有十分重大的意义。本研究随机选取了年龄为18~30岁的低度近视、中度近视、高度近视健康青年患者和正视眼健康青年人, 用OQAS客观测量了各项视觉质量参数。

注:r为Pearson相关系数;r (年龄) 为视觉质量参数与年龄的相关系数;r (SE) 为视觉质量参数与球镜屈光度的相关系数。

经过研究发现, 正视组、低度近视组、中度近视组三组间的MTFcutoff、SR、OSI、OV100%、OV20%、OV9%值差异均无统计学意义 (P>0.05) 。高度近视组的MTFcutoff、SR、OV100%、OV20%、OV9%值均明显小于正视组、低度近视组、中度近视组 (P<0.05) 。高度近视组的OSI值明显大于正视组、低度近视组、中度近视组 (P<0.05) 。

MTFcutoff、SR、OV100%、OV20%、OV9%均是与MTF值相关的视觉质量参数。MTFcutoff、SR、OV100%、OV20%、OV9%值越高, 表示视觉质量越好。OSI量化了屈光介质对光的散射情况。散射是指光线通过光学介质偏离其原来的传播方向而向各个不同方向散开的现象。OSI值越高, 表示眼内散射越严重, 视觉质量越差[14]。因此, 健康青年高度近视的视觉质量明显差于低、中度近视和正视。

此外, 本次研究还发现, MTFcutoff、SR、OV100%、OV20%、OV9%值与SE呈正相关性 (P<0.01) ;OSI值与SE呈负相关性 (P<0.01) 。这提示近视患者的视觉质量会随着近视度数的增加而变差。本研究结果与MIAO H等[4]的研究结果一致。本研究为随机、对照、横断面研究, 并且以正视眼作为对照组, 增加了研究结果的可靠性。

KAMIYA K等[15]对年龄在20~69岁的健康志愿者进行研究发现, 随着年龄的增长, 客观视觉质量发生下降, MTFcutoff、SR明显降低, OSI明显升高。而本研究发现, MTFcutoff、SR、OSI、OV100%、OV20%、OV9%与年龄之间均无相关性 (P>0.05) 。本研究的对象为健康青年人, 年龄范围小, 均在18~30岁, 屈光介质通透性均良好, 不会影响视网膜成像质量和眼内散射。因此, 健康青年近视患者的视觉质量不受年龄影响。

影响人眼视觉质量的因素有很多, 像差和散射是主要因素。像差和散射受年龄、屈光介质的屈光度、瞳孔直径、屈光介质的清晰度、眼别、眼部手术和外伤等因素的影响。本研究所选取的对象均为年龄18~30岁的青年人, 人工瞳孔直径均为4.0 mm, 均测量右眼的视觉质量, 排除了眼部疾病、手术、外伤史。因此影响本研究近视视觉质量不同的主要因素是屈光介质的屈光度。人眼屈光系统中, 角膜和晶状体的屈光度占人眼总屈光度的主要部分。人眼视觉质量很大程度上取决于角膜和晶状体之间的平衡和相互作用。分析造成青年高度近视视觉质量差于低、中度近视的原因主要有以下3点: (1) 随着屈光度的增加, 角膜、晶状体前表面变陡, 角膜、晶状体的前、后表面不理想; (2) 随着屈光度的增加, 眼球形态发生改变, 角膜与晶状体光学中心不同轴; (3) 随着屈光度的增加, 屈光介质变得不均匀, 折射率发生改变[16]。上述因素可导致入射光线偏离理想光路, 造成视觉质量下降。

评估近视视觉质量的方法大多为高阶像差、对比敏感度等[17,18,19]。本研究采用先进的视觉质量测量设备OQAS对研究对象进行视觉质量测量。OQAS是一种以双通道技术为原理客观评估视觉质量的仪器设备。双通道技术是指入射诱导光束和出射探测光束所经路径为两条不同路径, 避免了诱导光束和探测光束的混淆, 从而使测量结果更真实, 克服了传统视觉质量测量工具诱导光束和探测光束为同一路径的弊端[20]。像差和散射是影响人眼视觉质量的主要因素。OQAS能够测量高阶像差和散射对视觉质量的综合效应, 可提供人眼视觉质量的全部信息[21]。OQAS测量结果具有较好的重复性和再现性。OQAS的应用使本研究对青年近视患者的视觉质量测量结果更客观、更真实。

视觉决定风格,风格诠释视觉篇5

◎1995年赴美国留学并开始摄影创作

◎2006年回国创办绍剑摄影工作室

◎专注于大画幅数码影像的经典放印

寻找自己的视觉风格是摄影者永远的探索课题。明确的视觉风格也是“新经典风光”作品不同于其他风光作品的一个重要原因。如何让自己的作品脱颖而出，不论对于业余或是专业的摄影师都是最大的挑战，这需要有独树一帜的视觉角度加之娴熟的技术来相互配合形成自己的风格。

学习，是建立自己的风格的重要途径。每一个摄影人的心目中都有自己的崇拜对象，会反复观看研习他们的作品，在潜移默化中模仿他们的风格。我在美国留学时开始了自己的自然风光摄影之路，当时以亚当斯、韦斯顿等为代表的经典放印风格从很多层面深深影响着我的视觉趋向——良好控制画面光比，运用小光圈来给予画面从远到近最大的景深，使细节质感表现得淋漓尽致

这期间我也学习到了最重要的一课，就是每次影像的拍摄制作中，让自我特有的视觉感受来完全主宰着自我风格形成确立。当然，在开始时意图、操作和结果之间常常会无法衔接，这时的问题大多出现在视觉和技术两个元素的不平衡，毕竟摄影是手和脑的结合艺术。随着操作技术的提升，你会发现预想的效果会表现得越来越准确。

总是有人说，艺术感是与生俱来的，你或有或是没有，但以我的自身经历来说通过不断的练习，我们的视觉艺术感和创造性都会不断增加。在这儿就又要谈及亚当斯提出的“预想法”——在我们看到景物时，脑海中设想最终影像的效果，以此为依据进行速度、曝光、暗房等控制。有了这样的视觉思维，很快你会发现自己开始有了固有的视觉模式，也就是自己的风格。

当然，风格在很多时候又局限了我们的创造力，习惯性的模式会大大减少了原有的多角度的思考，解决这种局限性的最终办法还是在于学习，不是只了解摄影内的知识，更要多元地学习其他文化来充实内心世界。知识为大脑输送着“养分”，给我们新的感受和思维，使得我们看待世界的角度发生变化，风格也会循序发展。

再来谈谈数码影像对我们风格建立的帮助。今天数码影像已经完全占据了主导地位，但我们在学习数码技术的同时不要摒弃传统工艺，传统与现代是理念延续的关系，“新经典风光”不可能是毫无根基的创造，而是在传统、经典的基础上有所延续的创新，它们之间的很多理论都是由古至今传承下来的。学习传统工艺会更好地帮助我们掌握最新技术带来的便利，只有有了较高的影像控制能力才可能把每个人的视觉风格展现得淋漓尽致。

视觉质量篇6

视觉环境质量是公众对景观的视觉要素和心理活动共同作用的结果,影响着人们的审美情趣、生理和心理健康,视觉是用来感知和评价景观美的最主要途径[1]。心理物理学是一门研究建立环境刺激与人们感觉、知觉和判断之间关系的理论和手段的学科,20世纪70年代以来,被引入到风景评价及相关领域中,在自然风景、森林景观和旅游环境等方面得到广泛应用。近年来,这种方法应用于数理统计学,以确定公众偏好景观类型。它以公众评判为依据评价视觉环境质量的高低, 而不是依靠少数专家。并且可以比较客观地测定滨海观光道景观的物理特征,避免运用多样性和统一性等形式美原则或其它生态学原则所带来的不便。由此可见,心理物理学方法能够客观反映滨海观光道景观的实际视觉环境质量价值,同时又能方便地与景观建设结合起来,从而对滨海区景观设计者具有更直接的指导意义。

该文将此方法应用于大连滨海路景观视觉环境质量评价,深入研究公众对其视觉效果的喜好, 将滨海观光道与周围景观有机融合,提出北方城市滨海观光道视觉环境质量优化建议。

1研究方法

1.1研究地概况

大连市地处辽东半岛南端,滨海路是独具特色的滨海观光道,背山面海,地势起伏,自然景观丰富[2]。滨海路沿线于2009年陆续修建了长达21km的木栈道景观带,西起星海广场,东至海之韵,连接了燕窝岭、老虎滩、石槽和棒棰岛等几大城市滨海旅游风景区。选择此段作为研究地点, 极具代表性(见图1)。

1.2评价方法

用心理物理学方法建立滨海观光道景观评价模型包括3部分内容:(1)测定公众的审美态度, 即获得景观总体视觉环境质量;(2)分解并评价景观各要素量值;(3)建立视觉环境质量与各要素之间的关系模型。同时,评价者使用比较评判法(Law of Comparative Judgment,LCJ)对景观要素之间比较后按视觉环境质量高低进行具体分级,采用7级(1~7)法。此法提供的信息量大,精确度高,是最稳定的一种方法[3]。

1.2.1获取评价照片选择2013年7月初天气晴朗的一天10∶00~12∶00,按照观光者进入滨海路西部起点星海广场向北部海之韵推进拍照,道路全长约21m,确定500m为拍照间距,数码相机定点取景。从游客视觉审美角度将观光道靠近海洋一面的主要景观要素拍摄在内,在相同的技术规程下完成:横向拍摄,角度一致,人眼视线高度。拍摄共取得43张景观照片,基本涵盖了观光道景观要素:远景的天空、山体、海洋,道路侧翼自然及人工景观,因此将拍摄到的43张照片全部作为研究材料进行视觉环境质量评价。

1.2.2视觉环境质量评价国外学者针对评价人群的评价差异性进行研究,表明不同类型的人群在景观美学评价上具一致性。以照片为媒介进行公众景观美学评价经济易行,已有针对性研究证明其可靠性[4]。将43张景观电子图像洗出纸质照片,随机打乱次序,逐一编号,于2013年7~ 8月期间展示给公众,给照片打分。为了保证该次评判的相对准确性,每个景观样本至少应有20 ~30人参加评价,参与评价的各类人群共计200人。要求评价者设想自己正在滨海路上观光,根据照片中景观要素按美感程度凭借第一印象给每张照片评分,并强调应关注照片中的景观而不是照片本身的质量。从照片中选出几张最喜欢和最不喜欢的景观照片,给予7分和1分,1分表示最不喜欢,7分表示最喜欢,再以最喜欢和最不喜欢的照片作为参考给剩余的照片打分。

1.2.3景观要素分解参考国外学者Arriaza[5]及国内姚玉敏[6]等学者在景观视觉质量评价中所提出的有关景观要素,Ergin等[7]提出的沿海景观评价指标,结合滨海路景观的实际情况,邀请四名专家,从观光道侧翼景观和公众整体感知入手, 提出滨海观光道景观要素评价标准(见表1)。

1.2.4测定景观要素指标量化值根据表1所示的景观要素的评价标准,50名专业学生及教授组成的专家组对43张照片的16个评价要素打分,分值为0~4。最终综合各专家意见,确定每张照片的16个评价指标的量化值。

1.2.5数据处理该研究将公众评价结果输入Excel软件进行数据的初步处理,确定每张照片的视觉环境质量(Average Visual Quality,AVQ) 值。在这些数据的基础上,使用SPSS分析各要素和景观视觉环境质量值之间相关性,采用逐步回归(Step-wise)方法进行回归分析,构建评价体系数学模型。

2结果与分析

2.1夏季景观视觉环境质量

公众对不同滨海路景观的视觉环境质量评价的均值见表2,公众相对喜欢(得分较高)的照片为S4、S21、S35和S39(见图2),公众相对不喜欢(得分较低)的照片为S5、S8、S32和S9(见图3)。比较两组照片景观要素构成,公众偏爱以海洋、山体及植被自然景观为主构成的滨海观光道整体环境。评分较高的照片视点较高且视域开阔,能俯瞰海景,伴有大连独特的山脉、崖壁及岛屿景观;特色突出且能融入自然的小品景观。 Fyhri等[8]在沿海地区调查研究表明,游客偏好植被和景观要素的典型性,这与该文调查结果具有一致性。评分较低的照片植物覆盖率较低;建筑等人工景观无法体现大连人文特色,且体量较大,遮蔽了海洋等具特色的观光道景观,对于临近海洋的优势资源没有充分利用。

2.2夏季景观视觉环境质量与各景观要素之间的关系

2.2.1相关性分析公众评判值呈正态分布时, 方可进行下一步的分析研究。该研究视觉环境质量值经Kolmogorov-Smirnov检验,P=0.871> 0.05,表明数据呈正态分布,可以做进一步分析。该研究的评分标准是等距间隔的,很多评分具有相同的秩,因此采用Kendall’s tau-b分析,并采用双侧检验。公众对景观视觉环境质量与各景观要素的相关性关系见表3。可以看出,1水体、7植物轮廓线、12焦点景观、13色彩种类、14整体色彩对比,共5个要素与视觉环境质量呈显著或极显著正相关关系;10有弊的人工景观、11视野开阔性,这2个要素与视觉环境质量呈显著负相关关系。

夏季观光滨海路时,公众视觉观赏角度更注重观光道整体景观———视野开阔,植被形成平滑轮廓线,Ramírez[9]和Fyhri等[8]研究表明,植物群落形成的景观确实能增加视觉环境价值。整体感知观光道夏季景观色彩,主要为天空的蓝色、植被及木栈道的绿色和棕色自然基调,在此基础上, 色彩丰富且对比强烈的景观照片视觉环境质量高。人们对于自然要素中的水有着独特的偏爱, 该研究表明可视水体越广阔,视觉环境质量越高, 且有研究已经证明了水体的视觉价值[1]。研究结果还表明,照片中焦点景观提高了景观视觉环境质量值,有弊的人工景观越多越易造成视觉环境质量的下降。

3.2.2线性回归分析及构建模型该研究线性回归分析采用逐步回归法(见表4)。将轮廓线(X1)、水体(X2)及色彩种类(X3)3个景观要素构建回归方程,得出滨海观光道夏季景观视觉环境质量评价模型:Y=1.972+1.206 X1+0.862 X2+0.378 X3。该回归方程的修正系数R2为0.711,说明该回归方程的拟合度较好。为保证线性回归分析模型的可靠性,对数据进行方差分析和多重共线性检验。方差分析中,F=35.42,P= 0<0.05,说明该回归关系具有统计学意义,存在线性关系。多重共线性检验中,一般认为容差< 0.2或方差膨胀因子>10时,存在多重共线性问题,该研究中反映多重共线性指标的容差和方差膨胀因子数值见表4,因此,该模型变量之间不存在多重共线性问题,建立的模型可靠。

由模型分析可知,7轮廓线、1水体和1 3色彩种类对滨海路景观视觉环境质量有显著正面影响,各要素间不是简单的独立反映景观的视觉环境质量。通过专家对各景观要素主观赋值与公众视觉审美客观评价相结合的方法,使景观评价数学模型具有一定说服力,多要素的不同贡献度决定了景观视觉价值,可以用于初步预测未来景观的视觉环境质量。

4结论与讨论

从评价结果可知,水域的可见程度影响景观视觉效果。面对壮丽浩瀚的大海,人们所能感受到的天之蓝、水之阔是其它内陆城市所不能比拟的。但由于滨海路依山势而建,坡地较多,视距受阻,道路曲折,方向多变,导致公众认知环境的能力相对减弱。因此,居高临下及视野开阔的空间更易于表达整体感及导向性,使人充分认知自己的定位,并更好地感知海景空间。如在坡顶处矮化植物基础种植,打开遮挡视线的视觉屏障;在地形平坦且视域良好地段设置观景平台,提供游人驻足观赏的开敞空间,对滨海观光道海景空间的表达作用尽显无疑。

游人在行走过程中,由单一景观构成的路段缺乏视觉的感官刺激,易使人精神疲惫。通过合理设置焦点景观,激发游人兴奋点,作用于一定层次的审美潜意识,从而提高观光道景观视觉环境质量,使人们心情愉悦,缓解旅途疲劳。沿途特有寓意和象征的人文景观、景区标志性景观及观赏游园等景观节点,都可作为分布于观光道上的兴奋点;但观光道多数地点不具备驻足欣赏、休憩的条件,可以通过植物群落中增添彩叶树种、合理配置创造自然和谐色彩空间融入道路景观,营造富有韵律感的形象景观廊道,应用地域性的色彩对比传达通俗易懂的信息,引起游人的好奇心理,调节游人的视觉感受和心灵体验,从而放慢步伐,达到舒缓心境、减轻压力的目的。

美好的自然环境自古为人类所追求,随着我国城市化水平的提高,山海自然资源愈发显得珍贵,滨海观光道景观规划设计必须坚持生态资源的保护与恢复,使道路与自然地形和沿途自然、人文景观保持和谐关系。从数学模型可以看出,自然植物群落的轮廓线平滑程度成为景观视觉环境质量评价的重要因素。平滑的轮廓线使观光道形成连续而又富有变化的景观序列,游人的视线通过不同特色的植物景观,时而展现开阔山海景观, 时而进入私密休憩空间,产生一种节奏感,获得了良好的景观效果。滨海自然资源尽可能地保持和保护原有的格局,按美学理论的构图原理纳入公众的视野中,是提升视觉环境质量重要方法。

视觉质量篇7

经过阈值分割的二值图像,其目标被分割成彼此分离的连通区域,对连通区域的标记在机器视觉领域里是一种非常重要的处理方法。连通区域标记过程就是要寻找图像中所有的目标对象,并且将属于同一目标对象的所有像素用唯一的标记值进行标记[1]。因此,通过某种方法把各个连通区域区分开来,分别研究各个连通区域的性质,是提取图像特征及进行目标检测和识别的重要一步。

本文提出了一种顺序扫描二值图像进行标记的算法。首先,分析了在扫描标记过程中由于连通区域的形状不规则引起的标记冲突,并建立了标记冲突模型;然后,在标记算法中增加回溯扫描算法对选择的两种典型情况的标记冲突进行处理[2]。实验证明,该算法可以准确标记出各种形状的连通区域。

1 顺序扫描标记算法中的标记冲突

设经过阈值分割的二值图像背景点的像素值为BJ,目标点的像素值为MB,扫描图像的方向为从左到右、从下到上,即从图像的左下端开始。dq代表当前扫描点(坐标为(i,j))和它的像素值,lt,tt,rt,ll,rr,lb,bb,rb分别代表与dq相连通的8邻域的像素左上、上、右上、左、右、左下、下、右下点及其像素值,各点具体的位置与坐标如表1所示。

顺序扫描标记法的思路是:从图像左下端点开始扫描,如果dq点的像素值为BJ,继续扫描;如果点dq的像素值为MB,则检查已经扫描过的ll,lb,bb,rb等4点的像素值,设tag为像素点的标记初值(初始值设为2),先做以下两种处理:

1) 如果ll,lb,bb,rb的像素值皆为背景色BJ,即扫描过的周围点没有被标记过,认为当前点dq为连通区域的第1个被扫描的点,则将标记为tag,即dq=tag,然后tag自动加1;

2) 如果ll,lb,bb,rb的像素值不全是背景色BJ,即ll,lb,bb,rb部分(或全部)被标记,且标记值相同,设为tagi,认为当前点和周围点属于同一个连通区域,则将dq点标记为此标记值,即dq= tagi。

上述处理是为了保证相邻像素点的标记值相同,但在扫描的过程中,会出现ll,lb,bb,rb不同标记值的情况。如图1和图3所示,原图像A和B本来分别只有一个连通区,但经顺序扫描标记后出现如图2和图4所示的标记冲突,其中BJ=0(省略),MB=1,2,3为标记值,导致同一个连通区域内出现不同的标记值,即出现标记冲突。它破坏了连通区域的连通性,也为后续处理带来了困难,为实现区分连通区域的目的,标记冲突必须消除。

2 回溯扫描算法

图2和图4标记突的出现,都是由于当dq=MB,并且ll=lb=bb=rb=BJ时,在同一个连通区域产生新的标记值而形成的,要直接从根源上消除标记冲突,比较困难。间接解决相对较易,当dq=MB并且周围的标记值不同(即标记冲突出现)时,增加回溯扫描算法,把错误的标记值修正为同一个连通区域的最初标记值,可实现连通区域的准确标记[3]。即在上述顺序扫描处理的基础上,增加回溯扫描处理。

如果dq点的ll,lb,bb,rb各点的像素值不全是背景色BJ,即ll,lb,bb,rb都被标记或者部分标记,但标记值不同,设为tag1,tag2 ,tag3 ,tag4,且tag1≤tag2 ≤tag3 ≤tag4,增加回溯扫描算法修改各标记值为tag1,并将dq点标记为此标记值,即dq= tag1[4]。

2.1 当ll和rb出现标记冲突时的回溯扫描算法

图2的标记冲突属于ll和rb标记冲突的一种情况,即lb=BJ,bb=BJ,ll≠BJ,rb≠BJ,且ll>rb;图5所示为更一般的此种情况的标记冲突的模型,图5中BJ=0(省略),MB=1,a和b为标记值,显然b>a;图4的标记冲突属于ll和rb标记冲突的另一种情况,即lb=BJ,bb=BJ,ll≠BJ,rb≠BJ,且lla。研究图5和图6中的标记冲突,不难发现:较大的标记值b是错标的。为了消除标记冲突对后续处理的影响,必须消除大的标记值,即修改大的标记值b为小的标记值a。为此,采用如图7和图8所示的回溯扫描算法可以完成此任务。

3 实验与分析

随着图像采集和处理技术的发展,利用计算机视觉进行玉米种子的质量检测逐渐受到人们的重视[5]。如何快速、准确地提取玉米种子的外形轮廓是进行玉米种子等级评定的一个重要环节[6]。在VC环境下,利用上述标记算法,对采集到的玉米种子图像进行试验。结果表明,该算法可以很好地消除标记冲突,准确地标出图像中任何形状的各个连通区域,如图9和图10所示。

4 结论

1) 利用顺序扫描标记法进行区域标记时,标记冲突现象经常出现。本文提出了回溯扫描算法,该算法在标记冲突出现时立即进行回溯扫描,对引起误差的标记值进行及时修改,从而在一定程度上减少了算法重复扫描的次数,提高了算法的运行效率。

2) 利用该算法对玉米种子图像进行处理试验,结果表明:算法能够准确标记任意复杂形状的连通区域,扩展上述算法,还可以通过计算不同标记值的个数得到玉米种子的个数,通过扫描特定标记值得到特定的连通区域的特征,从而对玉米种子的特征做出更多的判断(如面积、尖端定位、长轴和短轴等),为玉米种子图像的进一步处理铺平了道路。因此,该算法具有良好的应用前景。

摘要：在分析已有区域标记算法的基础上,提出了一种新的二值图像连通区域准确标记算法。顺序扫描和标记二值图像的各个像素点,准确判断标记过程中出现的标记冲突,并建立标记冲突的模型,在算法中增加回溯扫描算法,消除标记冲突引起的标记误差。实验证明:该算法可以准确地标记出各种形状的连通区域,与已有算法相比,扫描重复率低,运行准确,速度快,具有很好的应用前景。

关键词：种子质量检测,机器视觉,算法,二值图像,模型

参考文献

[1]徐利华,陈早生.二值图像中的游程编码区域标记[J].光电工程,2004,31(6):63-65.

[2]苑玮琦,张田文.血细胞图像的计数方法研究[J].计算机应用与软件,2000(5):61-64.

[3]张树生.一种基于线的标号传播二值图像连通体快速检测方法[J].计算机研究与发展,1994,31(10):51-54.

[4]崔屹.数字图像处理技术与应用[M].北京:电子工业出版社,1997.

[5]刘中合,李邦明,刘贤喜.基于图像处理的玉米质量检测技术研究[J].饲料工业,2006,17(9):22-25.

视觉质量篇8

目前,网络与实时多媒体通信之间的矛盾主要表现为接收端视音频媒体播放的流畅性和清晰性。随着无线和IP网络的迅速发展,对视频通信系统抗误码能力提出了越来越高的要求[1]。这是因为:a.窄带信道要求视频信源编码效率高,大幅度去除信源的冗余。也正因为这些具有高压缩率的编码方法,极大地削弱了压缩视频的抗差错能力。而信道误码会引起视频整帧图像、甚至后续图像的不可恢复,最终可导致视频通信的中断;b.现有的抗差错方法都有它的适用范围,如传统的ARQ不适合实时通信系统;FEC技术对无线信道传输中的突发误码效果极差等;c.视频源和网络信道条件是变化的,抗差错技术须动态地使用;d.视频编解码算法的高计算量和移动设备有限的计算能力,决定了在其上使用的编解码与抗差错方法都不能过于复杂。

对此,本文充分利用人体视觉模型的特点,将影响视频重建图像视觉质量的多种因素与差错控制技术结合起来,以此优化视频编码与信道编码的比特分配,设计出了一种视觉质量优先的视频抗差错方法(ERMV)。经实践检验表明,此方法在窄带高噪声环境下,能明显地提高重建视频的视觉质量。

1 影响视频重建图像视觉质量的因素

在视频通信中,影响重建图像视觉质量的因素主要有:"玛塞克"效应[1]、视觉中心[2](Foveation)与视频的帧率[3]。

1.1 视觉中心

生理学研究表明,人体视觉具有选择注意的能力,人体视网膜对视觉信息的采样率与空间位置有关,即人体视觉对关注点附近的图像质量要求较高,而对其它区域则要求较低。一般来说,人眼在观察物体时,以关注点X为中心(如图1所示),空域解析度快速且平滑地降低。利用视觉这一特性,可消除图像中大于截止频率的信息,以在极低速率下,让有限的视频比特流合理地分配,从而使视频重建图像的视觉质量可以接受。

1.2"玛塞克"效应

"玛塞克"效应是由于视频采用了基于块的粗量化编码方法,或视频码流中的误码所引起的。在日常生活中,由于很少见到由"玛塞克"所组成的场景,所以我们一旦见到由此组成的图像,就会感到非常别扭,从而会严重影响我们的观感。

1.3 视频的帧率

一般说,视频的帧率越高,则其中运动物体所呈现的连续感就越强,视觉质量也就越好。然而,如果仅仅强调提高视频的帧率,那么在低传输速率情况下,势必采用粗量化编码方法来适应低的传输速率,从而可能产生有害的"玛塞克"效应,降低视频的视觉质量。经研究表明,人体视觉具有连续感觉的最小帧率(Fmin)为16帧/秒。当视频的帧率大于Fmin时,人体视觉对帧率的变化不太敏感;反之,则较为敏感。

2 视觉质量优先的视频抗差错方法

在这里,我们合理地权衡影响重建视频视觉质量的主要因素--视觉中心、"玛塞克"效应和视频帧率--三者之间的关系,结合反馈、信道编码与误码隐藏技术,设计了一种视觉质量优先的视频抗差错方法,其实现方法为:

首先,根据用户的反馈所得到的视觉中心位置,对编码的视频图像采用视觉中心滤波处理;

其次,编码器将视觉中心滤波处理后的视频图像按预设的参数编码并封装成RTP包传输。当解码器检测到差错或用户视觉中心位置发生改变时,解码器立即通过改进的RTCP协议向编码器反馈RR包,即将解码器所检测到的丢包率(这里,RTP包在播放时刻后到达也视为丢包)等信息实时地反馈给编码器;

然后,编码器一方面根据接收端的反馈,对出错的RTP包进行有时延限制的重传;另一方面编码器根据接收端反馈的信息,自适应地调整编码参数,即:

(1)当帧率大于Fmin时,如果检测到RTP包的丢包率不小于Qmax(本文Qmax取5%),则降低编码帧率,从而达到降低视频数据的发送速率,以避免因移动设备有限的接收缓存溢出或网络带宽衰减等原因而导致数据包进一步丢失的现象;

(2)当帧率小于Fmin时,这时,人体视觉对帧率的变化较为敏感。如果此时检测到RTP包的丢包率大于Qmax,则保持帧率不变,将编码量化步长增1。该过程直到编码量化步长已经达到量化上限为止;

(3)如果当前量化步长已经达到系统量化上限,且仍检测到差错,则进一步降低帧率;

(4)若反馈给编码端的丢包率小于Qmax,且此时量化步长不小于初始设置的量化步长,则量化步长减1,否则,帧率增1。

在这里,为了保证视觉关注点附近的区域的重建视频图像的质量,对于视觉关注区域的宏块组织成单独的视频包,其量化步长不受上面控制算法的影响。并且当帧率发生改变时,编码时要重新计算每一帧所期望分配的比特数,即重新确定图像各宏块的量化步长。

在解码端接收到的数据中,对于视频帧头信息,即使是在高噪声的无线信道环境下,因采用了上面的带FEC的双重头部保护机制,其发生出错的概率也是非常小的,但对于其它的比特流数据,就难免会出错。同时,考虑到系统的运行平台可能是处理能力较弱的移动设备(如PDA等),所以本文采用简单、高效的误码掩藏方法,即对帧内宏块使用空域误码掩藏方法,对帧间宏块使用时域误码掩藏方法,来减少差错对重建视频视觉质量的影响。

3 实验结果

本文采用QCIF格式的测试序列"news",共300帧进行仿真实验,编解码器采用Microsoft公司所提供的参考代码fdam1-2.3,22。同时,采用3GPP/3GPP2[4]错误模式对实际的信道进行模拟,本文的误码率设为2×10-3。

图2是编码量化步长与视频平均PSNR值、编码码率之间的关系,从图可以看出,随着量化步长的增加,视频图像的PSNR值先是较快速地下降,然后变化趋于平稳;而节省的比特先是较快速地增加,然后其增加趋势逐渐减小,本文在设计ERMV方法时,较好地利用了这一特性。

图3是采用本文所设计的ERMV方法前后视频图像质量的对比图(图中白色圈所设定的区域表示视觉关注中心),其中图3(a)为原始图像,图3(b)为经视觉中心编码后的图像,图3(c)为无误码影响下的视频重建图像,图3(d)为有误码影响后的视频重建图像,图3(e)为有误码影响,采用部分ERMV方法(即没有采用解码端误码隐藏技术)的视频重建图像,图3(f)为有误码影响,采用ERMV后的视频重建图像。从图中可看出,采用ERMV方法,视频重建图像的视觉质量有了明显的改善。

4 结束语

文章针对窄带高噪声信道环境,利用人体视觉模型的特性,将视觉特性与视频的差错控制技术结合起来,设计了一种视觉质量优先的的交互式差错控制方法。在模拟实验与我们所设计并申请软件著作权的"移动视频监控系统V1.0"中的运用表明,此方法能有效地提高重建视频的视觉质量。

摘要：在窄带高噪声的信道环境下,保证接收端的视频重建图像的质量是十分困难的。文章充分考虑三种主要影响重建视频视觉质量的因素,用此来优化视频编码比特在视频各部分的合理分配,然后将节省的码字用于视频的差错控制,减少因传输差错对视频重建图像质量的影响。经实验表明,此方法能在窄带高噪声的信道环境下,明显提高重建视频图像的视觉质量。

关键词：视频通信,抗误码技术,视觉质量

参考文献

[1]王曜,奥斯特曼,张亚勤.视频信号处理与通信,第1版[M].北京:清华大学出版社,2003.

[2]Geisler W S,Perry J S.A real-time foveated multiresolution system for low-bandwidth video communication[C]//Proc.SPIE,Jul.1998,3299:294-305.

[3]宋彬,常义林.基于主观质量控制的数字视频综合抗误码技术[J].电子学报,2001,29(7):919-922.

视觉质量篇9

当前,图像质量的评价方法[1]大致分为三类:第一类是传统的客观评价方法,代表性的有均方误差(Mean Square Error,MSE)、峰值信噪比(Peak Signal Noise Ratio,PSNR)等;第二类是主观评价方法,如主观质量评分(Mean Opinion Score,MOS)和视频质量专家组(VQEG);第三类是基于人眼视觉特性的图像质量评价方法,也是近几年备受关注的研究热点。

实验应用中大都采用均方误差MSE和峰值信噪比PSNR来度量[3,4,5],它们是以评价对象和原始图像之间的差异作为主要参数来进行评价的。PSNR是一个表示信号最大可能功率和影响它的表示精度的破坏性噪声功率的比值的工程术语,它作为信号的失真测度,常用作图像压缩等领域中信号重建质量的测量方法。

假设一幅M×N的L级灰度图像原始像素为xij,重构图像像素为yij,1≤i≤W,1≤j≤H,L为图像的灰度等级,一般取值为256,则均方误差MSE和峰值信噪比PSNR的计算如下[6]:

图像压缩中典型的峰值信噪比值在30到40分贝之间,愈高愈好,即PSNR值越大,表示失真越少;MSE则正好相反,MSE值越大表示失真越多

2 传统图像评价方法的不足

通常,对于给定图像,人眼对感兴趣区域的失真往往较背景区域敏感,但是,MSE和PSNR值的大小只是反映了两幅图像在像素值上的差异,而与人眼的视觉观察效果没有任何关系。因而传统的图像质量评价方法有一定的缺陷。

图1所示,其中(a)为原图,(b)和(c)为质量退化了的图像。在实际计算中,(b)和(c)的MSE分别为303.0405、341.7655,得出的结果是图(b)效果比图(c)好;但当人眼观察时,一般都会认为图(c)的效果比图(b)好,原因在于图像质量降低的区域的位置在很大程度上影响了人眼主观观察质量的判断。对于人眼不敏感的区域,即使图像质量有了比较大的降低,但只要人眼敏感区域的图像质量比较好,总体上还是会给人“可以接受”的感觉。基于这样的考虑,我们把人类视觉注意模型引入到图像质量的评价中[7],提出了一种基于显著度的峰值信噪比图像质量评价算法,该方法可以把图像的主客观评价结合起来,达到较好的图像质量评价效果。

3 视觉注意模型

在众多视觉注意模型思路中,Itti[2]提出的基于数据的隐式注意视觉模型引起了广泛的关注。这种方法充分利用了神经生理学中感受野、侧抑制等研究成果,模拟人类视觉注意机制,认为像素与背景的特征对比才是吸引人注意的重要因素,而非像素特征局部的绝对值,并把这种对比定义为该点的显著值。Itti模型的主要思想是采用一种自底向上的注意机制提取输入图像的颜色、方向和亮度特征作为初级视觉特征,采用中央-周边差操作并归一化得到对应的特征显著图[2],再将各特征显著图线性组合得到综合显著图,最后采用胜者占有(Winner Take All,WTA)和返回抑制机制进行注意转移。

该模型提取显著图的方法主要分成四步:视觉特征的提取、显著图的生成、注视点的提取和击中率的计算,其中,击中率是用于评价提取的显著图的效果。结合胜者占有[77]和返回抑制,按照图中显著值由强到弱的顺序选取图像中的点作为注视点,依次找到显著区域所在的位置。图2列出了一些图像的显著图。

4 基于视觉分割图的图像质量评价

4.1 算法介绍

算法描述如下:

输入:原始图像xij和待测图像yij,图像大小为M×N

输出:SMSE,SPSNR

步骤:

(1)利用上文提到的Itti方法[]生成图像xij的综合显著图S(i,j);

(2)利用1-D直方图最大熵法以及大津法(OTSU)生成分割图SSeg(i,j);

(3)取出位于金字塔中第一层的显著图作为权重因子,并进行归一化:

(4)根据xij和yij,计算基于显著度的均方误差SMSE:

(5)依据计算出来的SMSE,计算基于显著度的峰值信噪比SPSNR:

4.2 实验结果与分析

为了验证上述结论,本文在美国得克萨斯大学奥汀分校图像与视频工程实验室建立的LIVE图像库的release2版本[9]上进行了验证。

LIVE数据集由29幅高分辨率、高质量、大小不一的彩色图像组成,考虑了五种类型的失真:jp2k、jpeg、wn白噪声、gblur高斯模糊、fastfading(在fastfading通道传输jp2k码流的过程中发生错误而失真的图像),总共982张图像。并且还给出了平均主观得分差值(Difference Mean Opinion Score,DMOS)评分,便于研究者使用。其中,DMOS是在MOS的基础上计算得到的,即DMOS是满分100和主观评分均值MOS的差值,DMOS=100-MOS,取值范围从1到100,并且,DMOS值越大,表明对应图像的主观质量越差。图3列出了LIVE图像库中的部分图片。

实验中随机选取4幅参考图像,对于5种类型的失真操作全部选取,总共99幅图像,分别计算它们的MSE,PSNR,SMSE,SPSNR值。采用如下的方法进行实验验证:图像张数N;把N张图像按DMOS值从小到大排序,得到向量sortDMOS;把N张图像分别按PSNR、SPSNR值从大到小排序,得到向量sortPSNR和sortSPSNR;分别计算sortPSNR、sortSPSNR与sortDMOS的均方根误差RMSE1、RMSE2。其中,均方误差值越小,说明该评价方法描述DMOS值更好。表2-3给出了它们的计算结果。

为了便于算法性能的比较[8],定义改善率R:

本文实验中用了两种分割算法:文献[2]中的1-D直方图最大熵法MaxEntropy和大津法OTSU[10]。表1给出了这两种分割算法对测试图像的计算结果。

从表1可得,由1-D直方图最大熵法计算得到的平均改善率为14.77%,大津法为14.88%,由此给出了改进的基于显著度的峰值信噪比SSegPSNR图像质量评价方法

5 结束语

本文主要介绍了传统的MSE与PSNR图像质量评价方法,并通过实验指出了这两种方法的图像质量评价与人眼对图像的感知不符的缺陷,因此引进了Itti视觉注意模型,并通过实验验证了该模型在注意点击中率上与人眼大致相符,在此基础提到的基于视觉分割图的图像质量评价方法,该方法应用在LIVE982张图像库的实验结果表明,该算法对于图像的的质量评价计算更符合人眼视觉机制对于图像的认知过程。

参考文献

[1]蒋刚毅,黄大江,王旭,郁梅.图像质量评价方法研究进展[J].电子信息学报,2010(1).

[2]施振祥.基于视觉注意模型的图像检索[D].厦门大学硕士学位论文,2010.

[3]Russo F,De Angelis A,Carbone P.A vector approach to quality assessment of color images[C].Victoria,BC,Canada:IEEE International In strumentation and Measurement Technology Conference,2008:814-818.

[4]Avcibas I,Sankar B,Saygood K.Statistical evaluation of image quality measures[J].Journal of Electronic Imaging,2002,11(2):206-223.

[5]Xavier Boix,Josep M.Gonfaus,Joost van de Weijer,Andrew D.Bagdanov,Joan Serrat.Fusing Global and Local Scale for Semantic ImageSegmentation[C].International Journal of Computer Vision,Online First,23 April 2011.

[6]Wang X,Yu M,Yang Y,and Jiang G.Research on subjective stereoscopic image quality assessment[C].Proc.SPIE Vol.7255,no.725509,San Jose,California,USA,Jan.,2009.

[7]汪孔桥,沈兰荪,刑昕.一种基于视觉兴趣性的图像质量评价方法[J].中国图象图形学报,2000,5(4):300-303.

[8]Huang Da-jiang,Yu Mei,Yang You,Jiang Gang-yi.Right view image evaluation method for stereoscopic image pair based similarity mea sure[J].Acta Photonica Sinica,2008,37(8):1693-1697.

[9]Sheikh H R,Bovik A C,Cormack L,Wang Z.LIVE image quality asseddment database[EB/OL].2005,http://live.ece.utexas.edu/research/quality.

视觉质量篇10

一、诗歌教学中应激发学生的想象

文学的旨归在于对真善美的追求，在这个追求的过程中，阅读者能够和几千年以前的传统文化中蕴含的滋养融为一体，扩展自己生命的长度和生命的容量。但是，文学作为语言艺术形式，描写形象和表达情感，将视觉形象的东西有效转化为我们能够感知的形象表达出来，并不是照相式的描摹，而是在诗歌语言中出现的大量留白，教师需要做的就是在教授诗歌中帮助学生填补文本中出现的空白。

譬如，李商隐的诗《锦瑟》，诗中出现了大量指向模糊、晦涩的意象群，因而也增添了学生对这首诗的理解难度。但是学生的联想具有着跳跃性和不连贯性的特点，所以教师虽然无法将诗歌中的全部信息准确地传达给学生，但是通过必要的提示和补充也可以帮助学生将整首诗的画面呈现出来。首先，应该明确作品中使用的典故：“庄周梦蝶”、“望帝啼鹃”、“东海鲛人”、“暖玉生烟”。这些典故之间和首联的锦瑟之间并无直接的逻辑联系，是因为中国古典艺术有含蓄、蕴藉的特点，作者的情感欲言又止，在诗的意象之间出现大量留白，也就是阴阳冷暖，美玉明珠，境界虽殊，而怅恨则一。诗人对于这一高洁的感情，是爱慕的、执着的，然而又是不敢亵渎、哀思叹惋的。从这首律诗里阅读者可以读到的是爱慕、是执着、是哀思、是叹惋。诗人用诗中的两句话表达出了几层曲折，而几层曲折又只是为了说明那种怅惘的苦痛心情。

二、诗歌教学中应引领学生走进古人的内心世界

教师应引导学生感受古代人的内心体验，我们的学生虽然已经步入青春期。但是由于他们长期在学校里过着三点一线的生活，很难直观地感受一些我们认为理所应当的生活体验，这里我们需要填补的就是情感体验上的空白。

譬如，蒋捷的《虞美人·听雨》这首词，词中其实写到了人生的三个画面，在文本语言中，我们之所以不能立刻理解这首诗涉及到的非视觉因素，是因为非视觉因素中融汇着我们的人生经验，少年疏狂，醉歌流连于楚馆秦楼，中年时候，羁旅断肠，落单的孤鸿叫断江阔云冷，老年以后，超拔人世，静静咀嚼走过的一生，人生悲欢离合都在一言难尽之中。这首词蕴含了丰富的人生经验和感慨。学生们很难对这些人生经验有一个非常清晰的把握，这就需要教师在教的过程中，尽可能地把蒋捷作为一个国家风雨飘零中古代士人的心境传达出来。正所谓“知人论世”。这样，可以帮助学生在脑海中完成非视觉因素的语言向视觉因素的转化，构建出可感知的形象画面，从而更好地理解词人所表达的情感，走进古人的内心世界。

三、诗歌教学中应引导学生感悟生命

文字本身作为文化载体，教师还要这个载体中传达给学生感悟生命的真正存在。这里可以看一下熟知的《天净沙·秋思》。在理解这首小令的时候，要把非视觉的因素扩展为视觉的图像，要求教师传达给学生丰富的人生经验来，填补诗歌字句之间的空白，真正洞见古典文学的真谛。

如，小令中提到的黄昏、古道和瘦马，都是中国文化中的特有概念，是我们一种血脉相承的文化传统。如果不对这些东西有一个感性认识，就很难体会到这一点，诸如诗中所体现出来的瘦马、古道的意象，现在仅仅存在于江西的赣州和安徽的徽州，首先应该引导学生对这些传统文化的东西有一种直观的体验，才能让学生理解诗歌之中的历史感和美感。有了这样的基础，就很容易带领学生对作品中描写的夕阳之下的古道，西风中，牵一匹瘦马行走天涯的羁旅游子有一种画面感了。这样，也有益于将诗歌中的非视觉因素向视觉因素的转化。

古典诗歌是一种美的艺术，也是一种感性思维的艺术，在这种含蓄蕴藉的古典艺术中蕴含着古代诗人的审美传统。如果在日常生活中能够准确把握古典诗歌和传统文化之间的联系，就能够切实有效地在教学实践中开展美的教学。探索古典诗歌非视觉因素向视觉因素的转化问题将成为在教学实践中需要探索的一个重要命题。

视觉质量篇11

图像是人类感知和机器模式识别的重要信息源, 其质量对所获取信息的准确性起着决定性的作用。随着信息化社会的到来以及信息高速公路的实施, 各行各业对图像的使用越来越广泛, 人们对图像质量的需求也越来越高。经过压缩的图像虽然为图像的存储和传输带来了极大的方便, 但图像质量有时却不尽如人意, 对于彩色图像而言, 压缩后图像的颜色损伤是普遍存在的, 但人眼对不同颜色的灵敏度不同, 因此不同颜色的损伤对图像质量的影响也各不相同。

颜色损伤对视觉感知图像质量的影响研究对数字电视、多媒体数据库、电子图书馆、卫星遥感图像等方面提供了有力的支持。目前针对图像质量评价的算法, 国内外的一些知名高校和科研机构, 如复旦大学、中国空间技术研究院、VQEG (国际电信联盟的视频质量专家小组) 、美国Sarnoff公司等, 都对其进行了长期深入的研究。

图像质量评价的主体是人, 因此人眼视觉特性 (HSV) 对评价算法的研究具有重要意义。但是, 对人眼视觉特性的研究涉及生理、心理等方面, 特别是对视觉的心理特性业界迄今仍难以找出定量的描述方法, 所以目前还没有一套全面的、统一的图像质量评价体系。

图像质量评价的方法有两种:①主观评价方法:设计实验, 由观测者对图像质量进行评价;②客观评价方法:采用算法对图像质量进行评价。其中主观评价方法天然地和人的主观感受相符, 但它费时、复杂, 还会受到观测者专业背景、心理和动机等主观因素的影响, 并且不能结合到其他算法中使用;客观评价方法方便、快捷, 容易实现并能结合到应用系统中, 但它和人的主观感受有出入。通常提到的图像质量评价算法是指客观评价算法, 其目标是获得与主观评价结果相一致的客观评价值。

2人眼视觉特性

由于压缩后的图像最终是供大众欣赏和使用的, 所以在设定图像压缩的有关参数时都需根据人眼的视觉特性来选择, 以使得压缩后的图像质量能满足人眼的要求。人眼视觉特性大致包括视敏特性、亮度感觉特性、视觉分辨力特性和彩色感觉特性等[1]。

2.1视敏特性

人眼所能感觉的光 (可见光) 是波长范围为380~780mm的电磁波。实验证明, 对于不同颜色的光, 人眼不仅有不同的颜色感觉, 而且有不同的灵敏度, 即对于辐射功率相同而波长不同的光有不同的光亮感觉, 人眼的这一特性称为视敏特性。研究表明:在明亮环境中, 人眼对波长为555nm的黄绿光有最大的敏感度;在黑暗环境中, 人眼对波长为507nm的青绿光有最大的敏感度。

2.2亮度感觉特性

人眼的亮度感觉是一个主观量, 它不仅取决于景物给出的亮度值, 而且还与周围环境的平均亮度, 即人眼的适应性有关。在平均亮度适中时, 人眼能同时感觉的亮度上、下限之比最大可接近1000:1, 而平均亮度过高或过低时只有10:1。

2.3人眼的分辨力

人眼分辨图像细节的能力称为人眼的分辨力或视觉锐度。分辨力除因人而异外, 还与景物的照度、景物的对比度等因素有关。当照度太低时, 分辨力就大为降低, 且分辨不出颜色。相反, 当照度太高时, 分辨力也不会再增加, 甚至由于“眩目”现象而降低。景物细节的对比度低, 分辨力也要降低。除此之外, 分辨力还与景物的运动速度有关, 运动速度快, 分辨力将降低。

2.4人眼的颜色感觉特性

为确切表示某一颜色光, 必须有三个独立的参量:亮度 (亦称明度) 、色调和饱和度 (亦称纯度) , 它们称为彩色的三要素。

2.4.1亮度

亮度表征色光对人眼刺激程度的强弱, 即引起明亮感觉的程度, 它与进入人眼色光的光能有关。对于发光物体 (光源) , 发光强度越高, 人眼感到越亮;而对于非发光物体, 其亮度取决于反射 (或透射) 的光能大小, 照射光源的光能越大, 物体表面对光的反射率越高, 物体的亮度就越高。

2.4.2色调

色调表征彩色之间的差异性, 反映颜色的类别。理论上讲, 在可见光谱中不同波长的光有不同的色调, 即应有无数种色调与波长相对应。但实际上对波长很接近的谱色光, 人眼并不能区别开它们的色调。从总体上看, 在可见光的波长范围内, 人眼大体能分辨出200来种不同的色调。当颜色太淡或亮度太大及太小时, 人眼对色调的分辨力也会下降。

2.4.3饱和度

饱和度是指彩色光所呈现彩色的深浅程度 (或浓度) , 即某色调的浓淡、深浅程度或掺白程度, 以百分比 (%) 表示。对于同一色调的彩色光, 饱和度越高, 说明它的颜色越深;饱和度越低, 说明它呈现的颜色越浅。

3主观评价

主观评价是直接利用观察者对被测系统质量的主观反映, 来确定系统性能的一种方法。国外的一篇论文[2]在这一方面进行了首次探索, 呈现了一个颜色损伤对视觉感知高分辨率静止图像质量影响的主观研究。本次主观评价实验严格按照主观实验评价标准进行, 请若干名实验员在主观评价实验室中进行实验, 分别进行彩色图像和黑白图像的主观评价, 为原始图像和不同压缩倍数的压缩图像进行打分。将实验所得数据进行分析整理, 得出相关结论。

3.1主观评价设计方案

3.1.1测试依据

GY/T 134-1998[4]数字电视图像质量主观评价方法

3.1.2评价用测试图像序列 (见表1)

3.1.3评价方法

测试分为彩色和黑白两个部分, 每个部分有七组图像, 每组有6张, 为同一内容的2张原始图像和4张压缩图像, 每组的第1张为已知的原始图像, 其余5张是随机排列的压缩图像和原始图像, 测试人员为这5张图像打分, 主观评价经JPEG压缩后的图像质量相对于原图像的质量损伤情况。满分为100分。评分规则为:

与原图无可察觉的差别, 定为100—80分;

与原图有刚可察觉的差别, 不讨厌, 定为80—60分;

与原图有差别, 稍有讨厌, 定为60—40分;

与原图有明显差别, 讨厌, 定为40—20分;

与原图有明显差别, 非常讨厌, 定为20—0分。

3.1.4观看条件

主观评价在中国传媒大学主观评价实验室中进行, 其评价观看条件基本符合行业标准GY/T 134-1998中的规定。具体观看条件为:测试人员观看距离约为30cm;室内环境光照明强度低;测试人员的座位在图像水平方向中垂线±30°内。

3.1.5评价人员

本次测试邀请非专业评价人员14人, 均来自中国传媒大学。评价人员年龄在22~27岁之间, 其中男性3人, 女性8人。

3.1.6评价用仪器设备

PC机一台, 高清监视器 (1920*1080) 一台

3.2主观评价实验数据

根据ITU-R BT.500-11和GY/T 134-1998对原始数据进行了筛选, 在11人数据中保留了11人, 原始图像默认为100分, 各个图像的得分情况详见下表, 其中置信区间为95%置信度的区间。

3.2.1彩色图像评价部分 (见表2)

3.2.2黑白图像评价部分 (见表3)

需要说明的是, 在以上的实验数据中, 由于原始图像夹杂在压缩图像中, 人眼有时难以分辨出来, 因此会与理论上的100分存在一些偏差。但随着图像压缩倍数的增加, 人眼可以明显分辨出图像质量的下降。总体上不难看出, 受压缩倍数损伤影响较小的是“黄叶和绿地”, 受压缩倍数损伤影响较大的是“绿叶”。

3.2.3主观评价实验结论

各压缩倍数下测试图像的主观评价平均分如图1、图2所示。

每幅测试图像的质量下降总平均分如图3所示。

分析测试得到的数据显示, 对于彩色图片来说, 人眼对绿色的损伤最敏感, 因为随着压缩倍数的增加, 绿色的色调会发生显著变化, 图像的纹理越细、细节越多, 人眼越难发觉图像的变化;对于黑白图像来说, 人眼对图像损伤的灵敏度只和图像细节相关, 细节越少越灵敏。

4结论

颜色损伤对视觉感知图像质量的影响研究是一个非常有前途的研究方向, 它综合了多种学科, 将图像处理、图像理解、人眼视觉等多个领域的研究成果结合起来, 具有优质广泛的应用前景。如版权保护、公安系统、数字图书馆、医学等领域。从兴起到现在虽然只有短短的几年时间, 但也有了长足的进步, 不过由于图像特征描述和人眼视觉特性的复杂性, 其技术仍不成熟, 理论上还有很多问题有待解决。本文在前人的基础上主要做了如下工作:

本文在前人的基础上研究了基于人眼视觉特性的图像质量评价方法。主观评价方案参照国外的研究方法, 并在此基础上针对本课题的研究方向进行了改进。测试图像经过多次筛选, 原始图像和压缩图像之间的差异很小, 并且原始图像和压缩图像随机排列, 每组顺序各不相同, 极大地利用了测试者的整体主观感受能力。此外, 主观评价数据的整理和分析参照了ITU-R BT.500-11标准, 从而提高了主观评价实验结论整体的准确性。

鉴于有限的时间和作者自身的程度, 研究方法也存在一些不足。对本课题的研究还处在刚刚兴起的阶段, 随着压缩算法的不断创新和完善, 基于人眼视觉特性的图像质量评价还有很大的研究空间, 许多方法仍值得深入研究。

摘要：随着多媒体技术和互联网的迅速发展, 人们接触到越来越多的图像信息, 为了方便图像的存储和传输, 各类图像压缩技术应运而生, 而由此带来的图像损伤也是不容忽视的。如何评价图像的损伤, 是一个重要的研究课题。本次实验选择了不同纹理、不同颜色的测试图像, 利用JPEG程序对原始图像进行了压缩倍数为3、5、10、15不同程度的压缩, 分别进行亮度图像和彩色图像的主观评价实验, 并做出了主观评价实验报告。

关键词：人眼视觉特性,JPEG,主观评价

参考文献

[1]姜秀华.现代电视原理[M].北京:高等教育出版社, 2008.

[2]Francesca De Simonea, Frederic Dufauxa, Touradj Ebrahimia, Cristina Delogub, Vittorio Baroncinib A Subjective Study Of The Influence Of Color Information On Visual Quality Assessment Of High Resolution Pictures a Ecole Polytechnique Fédérale de Lausanne (EPFL) , CH-1015 Lausanne, Switzerland b Fondazione Ugo Bordoni (FUB) , Via Baldassarre Castiglione 59, 00142 Rome, Italy.

[3]ITU-R BT.500-11 METHODOLOGY FOR THE SUBJECTIVE ASSESSMENT OF THE QUALITY OF TELEVISION PICTURES.

【视觉质量】推荐阅读：

视觉选择05-08

视觉语境05-13

听觉视觉05-21

视觉风格06-01

视觉广告06-03

视觉元素06-23

视觉能力06-25

视觉引导07-09

三维视觉07-09

视觉研究07-24