图像信息(精选12篇)
图像信息 篇1
一、引言
在现代科技的高速发展下, 网络已经成为人类必不可少的工具, 网络上流动着大量的多媒体信息, 然而在信息共享的同时, 数据安全也严重受到了威胁, 在网络数据传输过程中特别容易被他人截获盗取。在这种现状下, 数据加密成为解决该问题的方法。它使得截获这些信息的人无法阅读, 同时也能验证接收到的信息是否被他人篡改或替换过。但数据加密的致命缺点也显而易见, 就是重要数据被提示, 从而引起盗取者或攻击者的好奇和注意, 利用一定的破解技术有被破解而得到这些重要数据。被加密的数据一旦被破解其内容就完全透明, 而且攻击者还可以在破译失败的情况下破坏数据, 使得即使是合法接收者也无法阅读信息内容[1]。
信息隐藏则完全不同于信息加密, 它是将重要的机密信息隐藏在其它各种类型的信息中, 从而形成隐秘信道, 除通信双方以外的任何第三方并不知道秘密通信这个事实的存在[2]。它与信息加密相比, 由“看不懂”变成了“看不见”。
本系统中的信息隐藏就是基于这种隐藏技术, 能够将任何数据以特殊的
加密形式隐藏到载体图片里, 而且隐藏前后, 载体图片肉眼看不出任何变化, 真正实现了数据由“看不懂”变成“看不见”。
二、本系统的基本原理
本系统利用人眼对低位数据的不敏感性, 将机密数据存放到图像像素点的随机低位中。可应用于对数据安全要求高的中大小型企业, 国家信息安全, 和对数据安全要求高的个人计算机。内置三种模式, 可全方位隐藏重要数据, 为数据安全提供根本的保障。
(一) 系统特点与创新性
1.信息隐藏算法采用基于LSB最低位算法基础上改进的随机有效位算法。
2.加入数据随机加密隐藏, 该加密算法是在国际通用标准RC4、DES的基础上改进的随机加密算法, 可在对数据进行隐藏前先使用该加密算法进行加密。
3.内置的数据加密算法由单结果加密改进为随机数据加密, 相同的数据每次加密的结果都不一样, 但解密结果始终为原始数据, 原数据对应了一万种左右的随机密文, 但一个密文只对应一个原数据。
4.数据隐藏时所选择的像素点具有一定的随机间隔性。
5.写入数据时采用了16循环乱序写入。
6.能直接使用本软件系统进行数据发送、实时聊天。
7.采用汇编字节集读取算法, 比普通算法快近3倍, 快速比对数据的异同, 并高亮显示。
(二) 系统设计的目标
1.实现数据由“看不懂”变成“看不见”。
2.实现非法接收人即使“看见”也无法破解, 也就是即使知道图片里隐藏数据, 没有本程序也无法正确提取出隐藏数据。
3.能及时查看隐藏前后图片的变化。
4.最快速比对数据异同。
5.内置客户端服务器网络传输模式, 实现数据的快速发送与接收。
(三) 实用性
本系统将随机加密算法和随机位的信息隐藏算法综合应用, 将信息由可“看不懂”变成“看不见”, 即使看懂也无法破解出真是信息, 可以应用于对数据安全要求高的中大小型企业、国家信息安全、对数据安全要求较高的个人计算机等行业, 尤其对于公安网中的信息传递有极大的应用价值。内置三种模式, 可全方位隐藏重要数据, 为数据安全提供根本的保障。
三、软件系统的技术框架
本系统在载入载体图片后, 会自动将载入的图片转换为24位位图。
(一) 信息隐藏的基本原理
24位位图图像像素点颜色结构, 如下图:
在24位位图中高8位构成蓝色通道, 中8位构成绿色通道, 低8位构成红色通道。经过程序测试, 在删除各通道的低4位数据并加入随机噪音后, 图片用肉眼无法观察到任何变化。现在展示一张图片在删除各通道的低位数据, 并加入随机噪音后图片的变化。
从图中的变化可以看出只有在替换高位数据后才会出现明显失真的现象, 在替换低三位数据是肉眼无法观察到变化, 替换低4位后虽有轻微的失真, 但在没有原图的状态下也无法看出破绽。于是在这种理论基础上我们就可以在这各通道的低4位 (共12位) 写入想要隐藏的数据。
(二) 本系统中最低位隐藏模式的基本原理
在本程序的隐藏方式中引入了随机位的概念, 即生成随机数, 根据随机数来选择写入隐藏数据的位置。在该模式下, 是4个像素点隐藏一个字节, 即一个像素点隐藏2位的数据。从前面的理论中可知, 每个像素点共有12位给我们隐藏数据, 现在我们只需要隐藏2位的数据, 则我们共有=66种隐藏的方法, 本程序则生成四个1到66的随机数, 然后将这四个随机数采用作者编写的标准转换为四个特殊字符或汉字, 然后采用高容量的模式将这四个特殊字符隐藏到特定的像素点中, 随后根据生成的随机数, 选择隐藏数据的位置并逐个像素点的写入欲隐藏的数据。被四整数余一的像素点根据第一个随机数写入, 被四整除余二的像素点根据第二个随机数写入, 四整除余三的像素点根据第三个随机数写入, 被四整除的像素点则根据第四个随机数写入。
该转换表并非加密转换, 而是像2战时所采用的密文一样, 随机生成后进行对应, 转换前后的数据无任何规律, 只有通信双方知道该标准。
(考虑本程序的安全性, 所以只公布少部分的转换表)
1.本系统中随机间隔隐藏的基本原理
对于比较小的数据, 不能填充到所有像素点都隐藏数据, 这时有可能会被统计低位数据分布、Cover-Stego等方法而判断出该图片隐藏了数据。这时本程序采用了随机间隔写入, 并在未隐藏像素点中适当写入随机噪音, 不仅解决该问题, 同时进一步加大数据提取的难度。
在本系统中会先计算载体图像的隐藏信息容量和隐藏信息大小, 将容量与隐藏信息大小整除取整得到一个间隔系数, 然后系统生成一个从1到该间隔系数的随机数, 同样系统按照上表的标准转换为某个字符, 然后采用高容量模式隐藏方式将该字符和隐藏信息的数据长度隐藏到特定的像素点中, 随后系统按照该随机数, 选择被隐藏数据的像素点进行写入。如:信息容量是156KB, 欲隐藏的数据大小为23KB, 整除得到6, 则生成1到6的随机数, 假设生成的随机数为3, 则选择进行隐藏的像素点在纵向上间隔为3。
2.本系统写入数据时的非顺序性
本系统在写入隐藏数据时, 并非按顺序写入, 而是以16为周期循环乱序写入, 将像素点位置对16求余, 然后按照下面的方案就行乱序写入。
3.本系统数据随机加密的基本原理
经过前面几步基本能保证即使知道图像里隐藏信息, 没有本程序也无法正确提取图像中隐藏的信息, 但一旦盗取者盗走该软件, 则可以轻易将图像的隐藏信息提取出来。为彻底保证隐藏信息的安全性, 程序中加入了随机加密隐藏的功能, 该加密算法基于国际通用标准RC4和DES, 能够保证数据的安全性。下面是随机加密算法的原理图:
四、系统的基本流程和主要功能
五、总结
在现在这个网络应用迅速普及的时代, 信息安全尤为重要, 目前信息传递的过程如何保障数据安全, 主要是采用数据机密和信息隐藏两种技术, 但仍有信息被窃取的极大可能, 本软件通过自主研发, 在加密算法上加入数据随机加密, 提高数据机密程度, 大大降低或完全阻止信息解密。在对数据加密后利用信息隐藏技术, 把“看不懂”的数据变为“看不见”, 采用基于LSB最低位算法基础上改进的随机有效位算法。使信息提取成功的概率大大降低, 有效改进了现有的地位隐藏算法, 从而为信息安全传递提供保障, 具有极大的社会应用价值。
参考文献
[1]陶奉芝.无损信息隐藏技术[D].青岛大学.2008 (05) .
[2]张绍武, 袁力.Internet信息安全技术的缺陷及创新[J].现代情报.2004 (11) .
[3]唐明伟.图像信息隐藏与隐藏分析算法研究[D].电子科技大学.2012 (03) .
[4]柏森.基于信息隐藏的隐蔽通信技术研究[D].重庆大学.2002 (04) .
[5]周琳娜;杨义先;郭云彪;胡岚.基于二值图像的信息隐藏研究综述[J].中山大学学报 (自然科学版) .2004 (12) .
[6]刘尚翼.加密域可逆信息隐藏研究[D].暨南大学.2014 (04) .
[7]曾宪庭.基于图像的无损信息隐藏技术研究[D].浙江大学.2010 (03) .
[8]胡自权.博弈论在信息隐藏中的生存能力研究[D].电子科技大学.2013 (03) .
[9]华铎.信息隐藏与检测技术的研究与应用[D].浙江大学.2006 (02) .
图像信息 篇2
感受图像信息
【教学目标】:
知识与技能:、掌握“画图”的启动和退出。
2、了解画图软件的界面和画图工具的基本结构与功能。
3、使用画图软件画一幅自然风景画。
4、保存画图文件。
过程与方法:
教师讲授、演示→学生操作、练习→学生提问、教师辅导、帮助。
情感态度价值
学习画图软件的使用方法,了解如何使用计算机处理图像信息,为我们以后学习更专业的图像处理软件打下良好的基础。
【教学重点】:
了解画图软件的界面和掌握画图工具的基本结构与功能。
【教学难点】
了解画图软件的界面和掌握画图工具的基本结构与功能。
【教学过程】
导入新课:
大家都喜欢在纸上涂涂画画,那么我们如何运用电脑来进行绘画呢?
今天,我们就来学习一个用来绘画的应用程序——“画图”。
教学新知:
、“画图”的启动
依次打开“开始”、“所有程序”、“附件”,单击“画图”命令,即可以启动“画图。”
2、认识画图窗口
启动“画图”后,会出现画图窗口,它由标题栏,菜单栏,工具箱,绘图区,颜料盒和状态栏组成。
工具箱:其中有十六种绘图工具和一个辅助选择框,为用户提供了多种选择。
颜料盒:由显示多种颜色的小色块组成,用户可以随意改变绘图颜色。
3、退出“画图”程序
有两种方法:
单击窗口右上角的关闭按钮。
单击“文件”菜单中的退出按钮。
4、“文件”菜单中常用命令的使用如下:
单击“文件”“新建”,可以新建文件。
单击“文件”“保存”,打开另存为对话框,选择保存在:
单击“文件”中的“页面设置”,可以进行页面设置。
单击“文件”中的“打开”命令,可以打开指定的图像文件。
5、学生自由练习使用各种功能。
6、教师演示:
画一幅自然风景画。
7、学生练习,教师辅导。
8、展示好的学生作品,进行点评。
9、保存文件后退出“画图”程序。
总结:
今天我们学习了画图软件的有关知识:启动和退出“画图”、“画图”窗口的组成、画图工具的基本结构与功能、“文件”菜单中的一些常用命令的使用,最主要的是通过使用画图工具画图使我们明白画图软件是一个非常实用的程序,我们应该熟练掌握它的使用方法,为我们今后学习更专业的软件打好基础。
作业:有条件的学生自己创作一幅作品,题材不限。
【教学后记】:本节课的内容学生很感兴趣,所以教学效果很好,不过要使学生熟练的掌握画图软件的使用,还需要时间反复地练习。
【板书设计】
感受图像信息
1、掌握“画图”的启动和退出
2、了解画图软件的界面和画图工具的基本结构与功能
3、“文件”菜单中常见命令的使用
4、使用画图软件画一幅自然风景画
图像信息 篇3
摘要:为了解决高速铁路轨道表面缺陷机器视觉检测系统中采集图像的冗余问题,本文提出一种钢轨表面图像冗余信息的模糊匹配算法。该种算法首先采用竖直投影法提取钢轨表面区域;之后对钢轨表面区域进行预处理并二值化,得到缺陷的位置信息;然后通过感知哈希算法,得到钢轨表面缺陷的形态信息;最后计算缺陷的位置误差和形态相似度,基于模糊匹配算法,得到匹配结果。通过实验验证,该算法能有效识别系统图像中的冗余部分,准确率达到97.5%。
关键词:机器视觉;钢轨;表面缺陷;模糊匹配
中图分类号:U213.4 文献标识码:A
随着铁路列车的不断提速,重载列车和城市地铁轻轨运营的增加,对铁路安全性、可靠性的要求日渐提高。由于受到天气状况恶劣、负载过大、行车速度快等因素影响,钢轨表面容易产生各种类型的缺陷,常见的有疤痕、裂纹、波纹擦伤、褶皱、剥落等。如果不及时对钢轨进行维护和更换,会发展成内部缺陷,造成严重的列车事故。因此,钢轨表面缺陷检测对维护铁路系统的安全运行非常重要。
目前钢轨表面缺陷检测主要依靠有经验的铁道工人目测巡检。这种检测方法不仅效率低、危险性大,还受人为和天气因素影响。随着技术的进步,超声、磁感应、电涡流感应、机器视觉等无损检测技术不断出现,尤其是机器视觉检测技术,已有一些研究人员进行了相应的研究并取得了一定成果。湖南大学采用线扫描相机采集钢轨图像,应用数字图像技术对钢轨表面缺陷进行检测,检测效率高,实时性好。中国铁道科学研究院研究了一种鲁棒实时钢轨表面擦伤检测算法,检测性能较高、速度快。
但是,上述算法仅对缺陷的识别做出了相应研究,对检测系统在采集过程中可能出现的冗余问题没有关注。由于在铁路维护过程中,一段钢轨可能要多次检测,因此会造成钢轨图像的重复采集。在钢轨分段维护中,路段与路段连接处也可能存在冗余信息。
钢轨表面缺陷的检测系统均采用线扫描相机采集钢轨图像,线扫描相机分辨率高,图像数据量大。以本文采集系统为例,若每次检测1000km铁路线路将采集至少25万张图像。所以,在使用大容量存储设备的同时,为了减少钢轨缺陷检测和分析的运算量,增加单次检测的里程,需要减少冗余图像。
在检测系统中图像采集的开始里程由人工输入,而后续里程则通过图像的采集量由系统自动计算,因此图像的冗余会影响采集系统中里程信息的准确性。为了提高钢轨缺陷定位的精度,冗余信息的去除也是非常有必要的。
钢轨缺陷的检测结果是铁路部门制定铁路维护计划的主要参考数据以及铁路损伤相关研究的资料,冗余信息的出现可能会造成缺陷识别结果的重复,影响检测结果的准确性,给后续的工作和研究带来不必要的问题。
因此需要研究一种识别冗余信息的匹配算法,以达到去除冗余信息的目的。由于无缺陷的钢轨图像高度相似,因此钢轨特征信息非常少,基于灰度和梯度信息都很难识别冗余信息。针对钢轨图像的高度相似性,本文通过钢轨缺陷的位置和形态的特异性,提出了一种钢轨表面图像冗余信息的模糊匹配算法,实现了冗余图像的识别功能。
1 成像设备
成像系统由线扫描相机和镜头、光源、控制设备3部分组成。相机选用DSLSA Spyder3GigE Vision线扫描相机,分辨率为1024像素,线扫描频率最高为68kHz,通过千兆以太网接口将图像数据传输到工控机。镜头接口为C口,焦距为25mm,光圈可调。采用超高亮度LED条形光源,对称安装于相机两侧对钢轨进行照明,以减少外界光线影响,提高成像质量。在轨检车车轮上安装旋转编码器,利用编码器信号控制相机的采集频率。轨道检测实验车如图1(a)所示,成像系统如图1(b)所示。
2 模糊匹配算法
匹配算法是将成像系统采集的钢轨图像运用图像处理技术,得到两幅图像中缺陷的位置误差和相似度,通过模糊控制算法,得到匹配结果。由于普通钢轨表面图像的无差别性,只能根据钢轨表面的缺陷识别图像的冗余。体现钢轨缺陷特异性的因素主要有两个:位置和形态。
因为采集过程中图像受光线、震动、噪音等影响,在不同采集情况下采集的缺陷经过图像处理后提取的位置信息不尽相同,因此,仅采用缺陷的位置信息难以判断两缺陷是否相同。缺陷的形态学信息也存在这种问题。故本文采用模糊匹配算法,计算缺陷位置误差及形态相似度并作为模糊匹配算法的两个输入,既可以充分利用缺陷的位置和形态这两个特异性特征,又能弥补单个特征单独使用准确性不足的问题。
匹配算法流程图如图2所示。
匹配算法包括以下步骤:1)钢轨表面区域提取;2)图像预处理、二值化及形态学操作;3)缺陷形态信息和位置信息获取;4)位置误差和相似度计算;5)位置与相似度模糊匹配。
匹配算法步骤中钢轨效果图如图3所示。图中(a)为成像系统采集到的钢轨图像,图像大小为1024×1024;(b)为采用竖直投影法提取到的钢轨表面区域图像;(c)为图像预处理后的钢轨表面区域图像;(d)为二值化后钢轨表面区域图像;(e)为形态学操作后的钢轨表面区域图像。
2.1 钢轨表面区域提取
成像系统采集到的图像如图3(a)所示,钢轨表面区域只占据图像中央一部分,钢轨两侧有很多石子、道钉等干扰物体,这些物体的存在不利于后续处理。因此为了降低后续处理的难度,需要提取钢轨表面区域如图3(b)所示。通过观察,钢轨表面区域与两侧区域的灰度值有明显的差别,因此本文提出了竖直投影法(Vertical Projection,VP)提取钢轨表面区域,主要步骤如下:
1)逐列累加图像f(x,y)中各像素的灰度值,并计算均值,得到图像的各列灰度均值数组Avg(i),Avg(i)如图4所示。
2)统计全部图像的灰度均值Avg_mean。
3)Avg(i)数组二值化,将Avg(i)数组依次与灰度均值Avg_mean比较,大于Avg_mean设为1,小于Avg_mean设为0,得到数组Avg_Val(i)。
在Avg_Val(i)数组中找到第一个连续10个值都是1的点,该点便是钢轨表面图像开始的边缘点Begin_Point;在Avg_Val(i)数组Begin_Point之后找到第一个连续10个值都是0的点,该点便是钢轨表面图像结束的边缘点End_Point,截取钢轨图像Begin_Point列到End_Point列之间的图像即可得到钢轨表面区域图像f1(x,y)。得到的钢轨表面区域图像如图3(b)所示。
2.2 图像预处理、二值化及形态学操作
在钢轨图像的获取过程中,容易受到现场环境、相机质量等因素干扰而产生噪声,影响匹配结果,因此,对钢轨图像f1(x,y)进行3×1中值滤波。为了克服钢轨表面光线反射不均匀的缺点,采用局部零均值法图像增强,得到钢轨图像f2(x,y),如图3(c)所示。采用文献中提出的PEMCV法得到图像的最佳分割阈值T,对滤波及增强后的钢轨图像f2(x,y)进行二值化,得到二值图像f2(x,y),如图3(d)所示。
由于钢轨缺陷周围存在一些亮点噪声,影响位置信息的准确性,使用形态学操作可以去除这些噪声点,而操作过度会导致缺陷的某些结构信息被消除影响形态信息的准确性。经过实验验证,本文使用9×9的椭圆结构元素对二值图像。f3(x,y)进行形态学操作得到图像f4(x,y),如图3(e)所示。
2.3 缺陷形态信息和位置信息获取
由于图像的冗余,在系统中记录钢轨图像采集位置的里程信息将不再准确,但缺陷相对于钢轨两侧边缘的位置不会改变,不同缺陷的位置具有特异性。因此获取缺陷的外接矩形就能得到缺陷相对于钢轨两侧边缘的位置信息。
寻找二值图像f4(x,y)中缺陷的外接矩形,得到钢轨表面第m个缺陷的位置信息Pm(LX,RX,XW,YH),其中,LX为缺陷外接矩形的左侧行坐标,RX为缺陷外接矩形的右侧行坐标,XW为缺陷的宽度即缺陷所跨列数,YH为缺陷的高度即缺陷所跨行数。
通过感知哈希算法,可以得到缺陷的形态数组。感知哈希算法以其高效、快速的优点在图像识别中应用非常广泛。在图像采集过程中,当采集方向不同时,缺陷的图像会发生180°的翻转,因此计算形态数组时需要将缺陷图像翻转180°计算两次。
具体步骤如下:
1)截取缺陷外接矩形内的图像f5(x,y),并将图像归一化到8×8尺寸。
2)计算图像f5(x,y)的哈希值作为缺陷的形态数组Dm1,形态数组是一组64位0或1数组。
3)将图像f5(x,y)翻转180。得到图像f5(x,y)。
4)计算图像f5(x,y)的哈希值作为缺陷的形态数组Dm2。
在钢轨图像中,除缺陷外还有钢轨的缝隙,在缺陷的匹配中钢轨连接缝隙会对匹配结果产生影响,因此需要在匹配前将钢轨缝隙剔除。因为钢轨缝隙为横向细缝,而钢轨缺陷不存在横向擦伤,所以形态数组数值全为1的必是钢轨缝隙。得到缺陷形态数组后检查是否数值全为1,若存在数值全为1的数组,则剔除该缺陷。
2.4 位置误差和相似度计算
对比两个缺陷的位置信息可以得到这两个缺陷的位置误差。对于位置差别较大的缺陷,在求取位置误差之前通过计算缺陷的高度差和宽度差便可初步判断两缺陷是否为同一缺陷,对于高度差或宽度差较大的一组缺陷,匹配算法可以在此结束,以减少匹配步骤,提高效率。
取带有缺陷的两幅缺陷图像Def1和Def2,分别计算得到形态数组Dt1,Dt2,Do1,Do2,及位置信息R(LX,RX,XW,YH),P0(LX,RX,XW,YH)。通过位置信息的对比初步判断两个缺陷是否为同一缺陷;对有可能为同一缺陷的数据进行下一步计算,得到两个缺陷的位置误差和形态相似度。
若Ep>0.2,则Def1与Def2不是同一缺陷,否则计算Def1与Def2的形态相似度S。
3)计算Def1与Def2的形态相似度S。
步骤a:统计形态数组Dt1与Do1中不同位的个数n1。
步骤b:计算Def1与Def2的形态相似度S1,相似度计算公式如下所示:
步骤c:统计形态数组Dt1与Do2中不同位的个数n2,根据公式(4)计算Def1与Def2的形态相似度S2。
步骤d:取S1和S2的最大值为S,若S<0.8则说明Def1与Def2不可能为同一缺陷。
2.5 位置与相似度模糊匹配
模糊匹配算法的输入量为钢轨表面缺陷的位置误差Ep及相似度s,语言模糊子集为{大(L),中(M),小(P)},位置误差的论域为[0,0.2],相似度的论域为[0.8,1]。隶属度函数如公式(5)和(6)所示。模糊控制器的输出量为匹配结果,用U表示,模糊子集为{是(Y),否(N)},由于本算法的匹配结果为是和否两个离散量,因此模糊输出变量不需要反模糊化,N表示实时获取缺陷与已存储缺陷不是同一缺陷,Y表示实时获取缺陷与已存储缺陷是同一缺陷。
模糊逻辑推理规则的结构为:If Sand Ep thenU。当缺陷的位置误差较大时,表明这组缺陷根据位置信息判断为同一缺陷的概率较小,因此只有当相似度也很大时,这组缺陷才可能是同一缺陷。当缺陷位置误差较小时,表明这组缺陷根据位置信息判断为同一缺陷的概率较大,因此只要相似度不是很小,这组缺陷就很有可能是同一缺陷。得到模糊规则如表1所示。
3 实验结果与分析
本文选取了40组带有疤痕缺陷的图像,其中,相同缺陷和不同缺陷的图像各占一半。实验数据如表2所示,表2中1~20组数据为相同缺陷的图像得到的数据,21~40组数据为不同缺陷的图像得到的数据。实验图像举例如图5所示。
由表2中实验数据可知:大部分相同缺陷的位置误差在0.05以下,相似度在0.95以上,如图5(a)所示。大部分不同缺陷的位置误差在0.2以上,相似度在0.8以下,如图5(b)所示。不同缺陷图像第39组位置误差较小,而且相似度较高导致匹配出现错误,这是因为感知哈希算法只保留了图像的低频信息,去除了高频的细节信息,当遇到形状结构相似的两个缺陷时,容易得到一个较高的相似度。
实验结果如表3所示。
实验表明:在实验的图像中,相同缺陷的图像全部被检出,而不同缺陷的图像有一组被检测,说明本文算法对于相同缺陷的冗余图像有很高的检出率,对不同缺陷的图像有一定的误检率。本文算法准确率为97.5%,能有效识别出钢轨图像中的冗余部分,而且误检率和漏检率较低,分别为5%和0%。
4 结论
敏感图像信息识别模型研究 篇4
网络技术的普及与Internet用户持续、快速的增加,使网络信息安全成为影响到国家安全与社会稳定的一个重要问题。各种色情、暴力、反动以及涉及国家安全保密的信息(包括图像、视频),越来越多地借助于互连网这种通信方式进行传播。从目前的情况来看,仅仅采用封锁网址的方式进行扫黄是不够的,对网络信息特别是敏感图像信息进行必要的技术监测和过滤,才能够有效地打击网络犯罪。
网络敏感信息监控是依据文本模式匹配和图像处理技术来建立网络敏感信息宏观监控体系,综合运用文本、图像处理技术,以及智能代理技术实现网络敏感信息的监测。本文所述的网络敏感图像主要是指含有色情信息的图像,提出了一个敏感图像信息识别模型。该模型综合使用肤色模型匹配、纹理判别和SVM分类技术对敏感图片进行识别,能识别网络传输的图片,判断其中是否含有色情内容,以减少和杜绝色情图像在网络上传播的机会。
1敏感图像信息识别模型
敏感图像的识别是通过对图片的内容进行分析来实现的。图像识别与指纹识别有所不同,由于图片本身的背景条件比较复杂,人体的表现形式也具有多样性,很难与指纹模型一样用一个单一的模型把所有的特征表示出来。
敏感图像多种多样,其最明显的特征就是有裸露的肌肤。因而进行敏感图片识别就可以从皮肤区域的特点进行处理。我们先对图像进行皮肤颜色模型匹配,检测出一幅图像中的皮肤区域。接着对图像使用小波分解和灰度共生矩阵提取进行纹理判别,以区分大部分和皮肤相近的区域,然后对输出的二值图像进行处理判断。最后再用SVM进一步分类考察,最后确定图片是否含有色情信息。图片信息识别模型决策图如图1所示。
1.1肤色模型匹配
1996年Fleck[5]等就利用计算机视觉和图像理解技术对色情图片识别进行了研究,通过对图片肤色分割和人体姿态的几何特征检测来判别图片中是否含有色情信息。目前肤色模型已经广泛应用于人及其局部特征的识别。
RGB是最常用的颜色系统,也是十分可靠的表达肤色信息的色彩空间。人脸的肤色在RGB色彩空间上一般分布于R[1 51,255]、G[97,239]、B[84,233]的区间,但人的肤色在RGB空间中的分布非常广泛,直接在RGB空间中进行处理难以达到从图像中抽取人体肤色区域的目的。本文将肤色在HUV和KL颜色空间中作分割处理。
YUV表示法中Y分量表示颜色的亮度信息,U和V两个相互正交的分量表示彩色信息。色度信号是一个二维矢量,称为色度信号矢量。每个颜色对应1个色度信号矢量,它的饱和度由Ch表示,色调由相位角θ表示。
彩色图像的像素P由RGB空间变换到YUV空间用数学表示为:
θ=tan-1(|U|/|V|)
在YUV空间UV平面上,肤色的色调介于红与黄之间,根据对大量图像的彩色分析,可以确定人的肤色色调θ的变化范围,如果满足条件:θp∈[100,150],则P是肤色点。该肤色模型能够有效地提取肤色区域,但是该模型也会把一些与人的肤色比较接近的其它区域当作肤色区域。
KL变换是建立一个肤色坐标变换以进行肤色判断。彩色图像的像素P由RGB空间变换到KL空间的坐标表示为:
然后再根据下面的阈值进行判断:
110.2<K1<376.3
-61.3<K2<32.9
-18.8<K3<19.5
在该范围内的置1,否则置0,从而得到过滤肤色的二值图像。KL寻找了一个合适的色系坐标系,具有集中肤色信息的作用。KL变换和YUV空间相结合,可以弥补两种方法的不足,能更好地分割出图像中的肤色区域。变换到YUV空间能将亮度信息与色彩信息分离;KL变换能减小每个分量的均方差,从而压缩阈值范围;将两者相结合,可以进一步缩小单纯使用KL变换的阈值范围,使肤色分布范围更加集中,增加最后肤色分割的成功率。
仅用肤色模型匹配方法对图像识别的过程中,对含有色情信息的图像有较高的正检率(判定其为敏感图像),但是也覆盖了较多的具有特定颜色以及特殊光照的非色情图像。因为肤色和非肤色空间本身是相互覆盖的,肤色过滤阶段出来的区域有一部分并不是需要找的肤色区域,只是在颜色上与皮肤很接近,我们还需要对此进行纹理判别,因为非肤色区域从纹理上讲并没有肤色区域一般光滑。
1.2纹理判别
纹理通常定义为图像的某种局部性质,或者说是对局部区域中像素之间关系的一种度量,纹理特征可用来对图像中的空间信息进行一定程度的定量描述。皮肤的纹理作为一种特殊的纹理,没有明显的纹理基元,无明显的周期性和方向性。一种纹理特征提取的有效方法就是以灰度共生矩阵为基础的。
灰度共生矩阵是建立在估计二阶组合条件概率函数基础上的纹理分析方法,反映的是图像关于方向、相邻间隔以及变化幅度的综合信息,描述了某方向上间隔一定距离的一对图像点灰度出现的统计规律。分析灰度共生矩阵就可以分析图像的局部模式和排列规则,也可以从中提取出很多图像的纹理特征,比如二阶矩、相关、对比度、方差、逆方差和熵等信息。通过灰度值等相关信息作为判定规则可以判断某一区域是否为皮肤区域。
为了减少灰度共生矩阵生成的复杂度并提高图像信息的识别程度,在此之前先使用小波变换对图像进行预处理。小波变换具有多尺度特征表达能力,能将图像的大部分能量集中到最低分辨率子图像。同时,小波分析方法提取的图像的特征矢量具有维数少的优点。
小波变换是一个常用的图像分析手段,并且在纹理识别中有较多的应用[6]。与傅里叶变换相似,小波变换是一种同时具有时—频二维分辨率的变换,其优于傅氏变换之处在于它具有时域和频域“变焦距”特性,十分有利于信号的精细分析。小波变换的另外一个重要优点就是小波分解和重构算法是循环使用的,易于硬件实现。
一个二维小波变换可以看作两个连续的一维小波变换。小波变换的结果取决于所采用的小波基的类型,而小波基是由滤波器的类型决定的。本文采用Daubechies-4小波。对一幅图像进行小波分解,得到一系列的小波系数,把分解出来的子图像称为小波分解通道。当图像在某一频率和方向下具有较明显的纹理特征时,与之对应的小波通道的输出就具有高能量。
经过肤色模型匹配以及纹理判别这两步操作以后,输出的是一幅二值图像,这时可对该二值图像进行处理和判别,也就是说对连续区域位置和皮肤区域所占比例的设置和判别,以判断该图像是否该划分为敏感图像。
1.3SVM分类判别
SVM在解决小样本、非线性及高维模式识别问题中表现出很多特有的优点。模型最后用SVM来进一步对色情和非色情图片进行分类考察,最后确定图片是否含有敏感信息。
SVM是一种以统计学习理论为基础的机器学习方法,它通过核函数将输入的样本映射到高维特征空间,然后构造“有敏感信息”和“没有敏感信息”的最优分类超平面,从而达到最大的泛化能力。作者以灰度共生矩阵参数和一些像素信息作为SVM的输入进行训练和测试,以达到分类的目的。
2模型分析
本文提出的敏感图像信息识别模型实现了对网络敏感信息的监控,模型对含有色情信息的图片的取真率比较高。模型具有学习功能,在经过一些小样本的尝试学习后,能达到一定正检率。本文在该模型基础上建立了一个含有5000副图像的小样本图库,其中包括640幅色情图像和4360幅正常图像(风景、建筑、人物和动植物图像)。实验结果正检率(敏感图像正确识别的概率)、误检率(正常图像被判定为敏感图像的概率)如表1所示。
3结束语
网络敏感图像识别技术是一项具有应用价值和研究价值的技术,本文提出了一个基于肤色匹配和纹理识别的图像信息识别模型。针对网络上敏感信息泛滥的情况,该模型可在网络敏感信息监控系统基础上自动对敏感图像信息进行检测和监控,适合在网络环境下使用。进一步要做的工作是提高识别和分类精度,以及提高对大量图像的识别应用中的效率,可考虑采用多个SVM分类组合方法。
参考文献
[1]段立娟,包振山,毛国君.多特征特定类型图像过滤方法.北京工业大学学报,2005,31(4):352-356.
[2]Daubechies I.Ten lecture on Wavelets.Philadelphies:Capital city Press,1992.
[3]尹显东,唐丹,邓君,等.基于内容的特定图像过滤方法.计算机测量与控制,2004,12(3):283-286.
[4]何江平,文俊浩,邓恬洁,等.基于支持向量机的图像识别.重庆大学学报:自然科学版,2006,29(1):57-60.
[5]Fleck MM,Forsyth DA,Bregler C.Finding naked people[A].In:Pro-ceedings of the4th European Conference on Computer Vision,Cam-bridge,UK,1996,2:593-602.
5.1 图像信息的采集加工 篇5
.1 图像信息的采集加工5.1.1 多媒体技术的发展与应用一、教学目标: 让学生了解多媒体技术的发展历史、多媒体技术在社会领域中的应用。二、教学内容: 1.了解多媒体计算机技术中的“媒体”类型和特征 2.简单回顾多媒体技术的发展历史 3.多媒体的关键性技术的几种类型及应用领域三、教学重点、难点:多媒体技术的发展及应用四、课时数:1课时教学过程一、什么是多媒体计算机技术①媒体:指承载信息的载体,如文本、图象、声音、动画等。②多媒体:两种或两种以上媒体的组合。主要集中在除文本以外的其他信息载体形式。③多媒体技术:指多媒体计算机技术,即运用计算机处理多媒体信息的技术。二、多媒体技术的历史回顾
单一媒体(最初是数字,后来主要是文字)发展为多种媒体的综合运用。三、多媒体技术的应用1、数字化信息技术2、高速计算机处理技术3、高效率压缩技术4、高容量存储技术5、高速网络传输技术几种常见的应用系统
例
特点
多媒体信息咨询系统
商场、医院导医、交通班次查询
多媒体信息管理系统
多媒体的图书管理、学生管理和企业管理系统
使日常的管理活动中单调枯燥的数据变得生动活泼起来。
多媒体辅助教育系统
多媒体学习软件、网络远程学习系统、虚拟实验系统
支持个性化学习
多媒体电子出版物
光盘读物、网络读物
有文字、插图,有声音、背景音乐,有动态视频等,存储和携带方便
多媒体视频会议系统
可以实现点对点,点对多点,多点对多点的声像实时同传
多媒体远程诊疗系统
借助网络和专用的传感装置实现远程诊断、远程治疗 实践题:根据实际情况,尝试着生活中多媒体技术的应用实例,填写下表
多媒体技术应用实例
应用的关键性技术
图像信息 篇6
我在具体教学过程中,立足于高中学生的数学思维特点,利用信息技术条件进行教学,制定了切实可行,行之有效的函数教学策略,教师教得有味,学生学的有趣,达到了较好的教学效果。
一、注重信息技术与数学课程的整合是新课标的要求。
新课标指出在高中数学教学,要坚持以人为本的教育理念,尊重学生的主体性,激发学生学习概念的兴趣,自主抽象概括形成概念,自觉应用概念解决问题。高中数学内容中蕴涵着大量的图像问题,如函数(指数函数、对数函数、幂函数、三角函数等),然而由于一些图像内容的抽象性和传统教学手段的制约,这部分内容不便展示,常常成为学生学习的难点;特别是代数中函数图像的认识,常常让许多学生迷惑不解。传统教学中的手段如挂图、幻灯、模型演示都无法反映图像的真实运动变化过程和图像内部的结构情况,信息技术时代的到来,使这一问题的解决已成为可能。新课程标准基本理念指出,要“注重信息技术与数学课程的整合”,高中数学课程应提倡利用信息技术来呈现以往教学中难以呈现的课程内容,加强数学教学与信息技术的整合,鼓励学生用计算机、计算器等进行探索与发现。目前,利用现代信息技术条件进行函数图像教学,已具备了较强的操作可能性,必然会对带动数学教学改革和信息技术手段的运用具有深远的现实意义。
二、利用信息技术条件进行函数图像教学模式的探讨具有重要的实践意义。
尽可能地利用信息技术条件进行函数图像教学是时代的要求,21世纪的竞争,归根结底是人才的竞争,而人才的培养取决于教育,教育成功的关键在于将最新的科学技术成果转化运用于教育,引起教育观念、方式和手段的革新。当今社会,科学技术正以迅猛之势发展,教育应紧跟时代的步伐。尽管各地教学设备有一定的差距,然而从我县各校电教设备的配备来看,完全高中均有多媒体教室、电脑教室、电子备课室,另外还有一些教学软件和下载的课件,供师生在教与学中使用,利用信息技术进行教学的条件基本趋于成熟。而如何转变教师观念,使信息技术地运用成为一种自觉行为,使现有的信息技术手段得到充分利用并高效地发挥其应有的作用,既能很好地体现学生的主体地位,又能发挥教師的主导作用,使课堂教学产生最佳效果,这仍是急需解决的问题。
三、利用信息技术条件进行函数图像教学有助于教学观念的更新。
随着基础教育改革的不断深入,大力倡导素质教育,培养学生的问题意识、动手能力和创新能力已成为中小学教学改革的核心。信息技术时代的到来,为中学数学课堂教学带来了千载一现的机遇,在一定程度,这一手段容易实现师生角色的转变,从而使教师转变为课程的设计者、学习的指导者、学习活动的参与者和组织者,学生从传统的接受式学习转变为主动学习、探究性学习和研究性学习,学生的主体地位将得到较充分的体现。应用信息技术条件教学,能够轻松地实现新课程中所要求的学生学习方式的转变,学生能够多方位、全程感受和经历函数图像的生成、变化过程,多媒体教室是学生的数学实验室。
四、利用信息技术条件进行函数图像教学有利于提高学生理解能力和记忆能力。
信息技术方便地实现数学对象的多重表示。信息技术使数学概念、理论及数学问题更容易用数字的、图形的、符号的、语言的等多种方式表达。学生可以在这些表达方法之间进行自由转换,既可以用计算机或计算器的数据处理分析功能、作图功能、可视性与动态显示效果,又可以通过图形的方法或数值的方法来探索数学,使得“多重表示与多重表示间的互相转换”这一重要的学习理论的实现成为可能。信息技术传递动态信息的特点使思维“可视”,为帮助学生理解数学提供“直觉”材料,为发展学生的数学能力提供了必要的感性准备。作为数学教学,视觉和听觉在提高记忆水平方面的重要意义。直观图像的刺激会强化学生的记忆,多媒体技术为学生的想象插上了翅膀,为学生理解和记忆知识提供了便捷的通道。
五、利用信息技术条件进行函数图像教学能更好地增强学生数形结合的意识、促进学生数学能力的提高。
数形结合能力堪称数学的四大能力之一,利用电脑软件的强大作图功能易于促进学生对基本初等函数及其性质的认识。在解决函数问题时难免会遇到一些抽象的推理问题,而图像是对抽象问题的形象化,因此学好函数图像是学好函数的关键,同时利用函数图像解决数学问题也是学生数学能力的重要组成部分。
六、利用信息技术条件进行函数图像教学有利于学生理解函数问题的本质
合理设计教学过程,采用行之有效的方法,使电教手段产生最佳效果,展示图像的形成过程,让学生能看到宏观世界中看不到的东西。利用电脑教室还可让学生尝试图像的制作、演示,从而使他们更加深刻地认识图像、把握图像的实质。这种做法不仅能够激发他们浓厚的学习兴趣,而且能促使学生迅速抓住问题的本质,提高他们分析问题、解决问题的能力。
七、利用信息技术条件进行函数图像教学可提高函数图像教学的效率
网络图像的语境信息研究 篇7
在互联网网页中, 图像通常都伴随着一定数量的文本信息, 这些文本信息与图像内容相对应, 被称为图像的语境信息。从网页中提取图像的语境信息具有广泛的应用价值[2,3], 其应用领域包括:
1) 网络图像检索:最典型的应用就是基于内容的图像检索, 依据用户提出的关键词检索出与之对应的图像;
2) 网络图像标注:找到合理地描述图像目标的词汇或语句, 标注结果不仅可以用于图像检索, 还可以用于图像管理和图像浏览;
3) 视觉概念的学习:是确定图像视觉特征与语义标注之间的关联关系, 通过学习的方式构建视觉特征到语义概念的翻译模型, 形成的视觉库可以为未标注的图像确定语义概念。
1 语境信息来源
早期, 研究学者从整个网页中提取图像的语境信息, 但是整个网页中含有大量与图像内容不相关的文本信息, 仅有少量的网页信息与图像内容相关, 为了提高效率, 应该缩小图像语境提取范围, 因此, 需要明确网页中可以提取图像语境信息的具体来源。在网页中, 图像语境信息的来源有:
1) 图像网址 (Image URL) :包含图像的文件名称以及其存放在网络服务器上的路径。如果图像的文件名称含有描述图像内容的关键词, 则该文件名可以作为图像语境信息的来源。通常, 网络图像的位置采用文件夹层级结构进行表述, 可以构建图像网址的分类标注。由于互联网中信息庞大, 图像数量不计其数, 如果使用人工标注完成每幅图像名称的标注, 是几乎不可实现的任务。在实际应用中, 目前大多数的网页图像名称采用数字标识以便于自动标注, 这样使得图像名称不具有实际语义含义。
2) 页面标题 (Page Title) :是对网页内容的简短描述, 其蕴含图像语义信息的概率较大。但是, 当网页包含多个主题时, 例如新闻主页包含了各类新闻信息, 网页标题应是新闻总称, 而与具体的新闻内容无关, 这种情况下, 页面标题不能作为图像语境信息的来源。
3) 全部文本 (Full Text) :包含文档文件中所有的文本信息。网络文档包含多个主题内容, 网页上的各类图像分别属于不同的主题内容, 同时, 网页还包含网站导航、页面布局、广告等噪声元素。如果从网络文档的全部文本中提取图像的语境信息, 针对性较差, 导致图像语义标注结果的效率较低。
4) 相关文本 (Associated Text) :专指与图像内容语义相关的那部分文本。例如, 有关图像内容简短介绍的图像说明就是提取图像语境信息最有效的来源。同前三种图像语境信息的来源相比, 相关文本作为图像语境来源更为可靠, 并且范围也更精确。因此, 如何确定网页中哪些文本与图像相关, 是正确提取图像语境信息的关键问题, 也是研究的重点。
2 图像语境提取方法
网页是半结构化文档, 对于嵌入其中的图像而言, 网页通常包含图像的内容描述[4]。如何从网页中提取图像语境信息, 是本文研究的主要内容。
2.1 页面分割
网页内容通常包含多个主题, 并且还包含了导航和广告栏等成分, 对提取图像语境信息造成干扰。由于页面结构对图像语境的影响, 在提取图像语境信息之前需要将网页划分为不同主题类型的组块, 每个组块表示同一个主题内容, 并且不同组块之间互不相交[5]。图1为某网页页面的分割示意图。
划分规则与网页内容有关, 将各个内容之间的距离作为页面分割的判断依据, 具体分割过程如下:
Step 1:对网页包含的内容进行分类, 根据HTML代码标签将网页内容分为4类:1) 锚:用<A>标签定义;2) 图像:用<IMG>标签定义;3) 客户端脚本:用<SCRIPT>标签定义;4) 文本数据:其余均为文本数据。
Step 2:根据标签的数量和深度, 计算紧邻的两个网页内容之间的距离。初始状态时, 所有标签深度均设为0。当标签状态为开始时, 标签深度加1;反之, 标签状态为关闭时, 标签深度减1。假设a和b是相邻的两类网页内容, 则两者之间的距离计算公式如下:
其中, xa, xb分别表示a和b在页面HTML源代码中的标签次序;ya, yb分别表示a和b的标签深度;fab (i) 表示第i个标签的深度值, 且i的取值范围在xa到xb之间。
Step 3:将网页内容距离M (a, b) 与预先定义的阈值TN进行比较, 如果M (a, b) >TN, 则将两个网页内容a和b分割为两个组块;如果M (a, b) <TN, 则a和b归为同一组块。
页面分割的核心思想是将整个网页作为一个单元块, 然后对单元块进行反复分割, 将其分解为不同内容特征的子块, 图1中页面分割得到的子块之间的关系如图2所示。
2.2 相关度计算
按照主题的类型对页面进行划分, 将主题相同的文本内容划分为一类, 而每幅图像根据其具体位置可以分别归属于某个页面子块。以页面子块作为图像语境信息的提取范围, 既缩小了对应文本的查询区域, 又提高了文本与图像之间的关联程度。
在每个页面子块中, 计算图像与文本单词之间的相关程度, 选取相关度高的文本单词作为图像的语境信息。假设某个页面子块中蕴含的主题为z, 文本内容中的单词用w∈{w1, w2, …, wN}表示, N为单词个数, 任意两个单词与主题之间的关联概率[6]计算公式为:
其中, P (z|wi) 和P (z|wj) 分别表示单词wi和wj与主题z的关联概率。
若任意两个单词wi和wj出现在同一个主题中, 则称这两个单词具有共生性[7]。单词共生概率的计算公式为:
其中, D是主题为z的图像个数, num (wi, wj) 是wi和wj同时出现的图像个数。
因此, 用主题相关性和共生性来表示两个文本单词的同构性, 即单词间的相关度由公式 (4) 计算得到:
其中, λ为权值调节参数。
需要指出的是, 这里提到的任意两个文本单词中可以同为名词或者一个为名词, 另一个为动词, 忽略了文本中的形容词、副词等修饰性词汇, 通过动宾结构或主谓结构达到简洁有效地描述图像内容。
3 实验结果
为了验证本文提出的网络图像语境信息提取方法的有效性, 选取5类百度图片搜索结果共1 000张图像作为实验数据集, 实验结果如图3所示。
实验结果中, λ=1表示计算单词相关度时没有考虑单词的主题相关性, 准确率较低。λ=0表示忽略了共生性统计, 此时准确率也较低, 但是较高于λ=1。λ=0.3时, 既利用了单词的主题相关性, 又利用了单词的共生性, 图像语境信息提取的准确率达到了最高, 表明本文方法是一种有效的网络图像语境信息提取方法。
4 总结
了解网络中图像的语境信息来源, 有助于设计提取网络图像语境的算法。由于应用对象设定为网络图像, 这类方法均与HTML代码有关, 因此还需要掌握网页HTML的相关知识。通过提取图像的语境信息, 可以得到图像的语义描述, 其结果可以应用于网络图像检索、网络图像标注等方面, 这也正是我们下一步的研究方向。
摘要:网络现在已经成为人们获取信息的重要来源之一, 而图像又是网络传递信息的一个重要手段。准确提取网络图像的语境信息, 根据图像的语义内容对其进行归纳分类、检索排序, 可以提高网络数据的管理效率。本文对网络图像的语境信息来源进行分析, 提出了基于页面分割的图像语境信息的提取方法, 经过实验验证了该方法的有效性, 并指出下一步的研究方向。
关键词:图像,网页,语义内容
参考文献
[1]谢毓湘, 栾悉道, 吴玲达.多媒体数据语义鸿沟问题分析[J].武汉理工大学学报 (信息与管理工程版) , 2012, 33 (6) :859-863.
[2]张涛.语义在互联网图像检索中的应用[J].青海科技, 2006, 13 (5) :66-69.
[3]田枫, 沈旭昆.基于标签集相关性学习的大规模网络图像在线标注[J].自动化学报, 2014, 40 (8) :1635-1643.
[4]Coelho TAS, Calado PP, Souza LV, et al.Image Retrieval Using Multiple Evidence Ranking[J].Knowledge and Data Engineering, IEEE Transactions, 2004, 16 (4) :408-417.
[5]Hattori G, Hoashi K, Matsumoto K, et al.Robust Web Page Segmentation for Mobile Terminal Using Content-distances and Page Layout Information[C]//Proceedings of the 16th international conference on World Wide Web.ACM, 2007:361-370.
[6]Biggers LR, Bocovich C, Capshaw R, et al.Configuring latent Dirichlet Allocation Based Feature Location[J].Empirical Software Engineering, 2014, 19 (3) :465-500.
图像信息 篇8
传统的图像梯度[1,2,3,4]仅仅基于亮度信息。但是,人眼对色度的分辨能力远远大于对亮度的分辨能力。当图像中存在两个颜色不同、亮度相近的相邻区域时,属于光照均匀分布但物体表面的材料性质有所不同的情形,利用传统的梯度提取方法则将无法找到相邻区域的边界。因此需要在描述梯度的同时考虑色度信息与亮度信息的视觉影响。
目前,已有多种算法在如何利用色度信息上进行了不同尝试。Koschan将图像RGB三通道颜色作为一个三元向量,利用向量的相关系数来表示图像梯度[5]。Wesolkowski和Jernigan不仅考虑了相关系数,还利用像素在RGB空间的欧氏距离表示梯度[6]。Weijer提出光度准不变量特征( Photometric Quasi - Invariants) ,以此来克服阴影的影响,更鲁棒地表示梯度[7]。黄伟等人用四元数来表示颜色,通过四元数的乘积分量来表示梯度[8]。但无论是向量相关系数、光度类不变量,还是四元数乘积分量,其梯度数值均无法与人类视觉感知的梯度强弱建立线性对应关系,因此此类色度梯度描述很难与亮度梯度描述进行结合。
本文在基于亮度梯度提取的基础上,采用了CIE -L*a*b*颜色空间对色度进行表示。在CIE - L*a*b*颜色空间中,不同颜色之间可用欧氏距离对颜色差异进行线性描述[9],因此利用此色度欧氏距离,色度梯度信息与亮度梯度信息可以融合在一个统一的梯度提取框架之下。由于亮度的欧氏距离很好地反映了人眼对光度差异的感知,而在CIE - L*a*b*颜色空间中的颜色欧氏距离与人眼的颜色差异感知相互吻合[9],因此本文方法能更好地基于人眼视觉特性对梯度进行描述。经实验验证,本文方法在不同亮度差异、色度差异下均能有效地提取出与人眼感知相一致的梯度结果。
1 基于亮度与色度的图像梯度提取
在本节中首先给出图像梯度的定义,而后分析了如何在亮度空间及色度空间获取图像梯度,最后把亮度梯度与色度梯度融合在统一的梯度表示框架之下。
1. 1 图像梯度定义
图像梯度是用来描述图像像素之间变化剧烈程度的有效特征。这种变化既包括亮度差异也包括色度差异,它对应于图像的一阶导数。当把图像看成二维离散函数I( x,y) 时,图像梯度就是对这个二维离散函数进行求导
式中: ( x,y) 是图像像素的二维坐标; dx与dy代表沿图像水平、垂直两个方向的单位向量。对于数字图像, 与 可通过一阶差分代替一阶微分,即
1. 2 基于亮度的图像梯度提取
在描述图像亮度时,采用YUV颜色空间。YUV颜色空间发明于彩色电视与黑白电视的过渡时期。黑白电视只利用亮度分量Y ( Luminance) 来表现画面,其亮度差异很好地符合人眼对亮度强弱的视觉感知。
给定一幅RGB彩色图像传统,其亮度Y分量按式( 3) 计算获得
对应的基于亮度的图像梯度为
亮度梯度的模值为
2. 3 基于色度的图像梯度提取
在描述图像色度时,采用CIE - L*a*b*颜色空间。CIE L*a*b*颜色空间是在CIE XYZ颜色空间基础上的改进模型,它利用Mac Adam椭圆描述的颜色差异程度,并建立线性化的颜色差异的感知模型[9]。RGB空间到CIE - L*a*b*空间的变换过程如下
式中: ( X0,Y0,Z0) 是白色参考点在CIE - XYZ颜色空间的数值。利用此白色参考点,可实现CIE - L*a*b*颜色空间的正则化。
L*,a*和b*三者的非线性关系意图模仿人眼对颜色的非线性响应,以此使得在CIE - L*a*b*模型中均匀的数值变化对应于在人类感知中颜色的均匀变化。所以在CIE - L*a*b*颜色空间中任何两个颜色的相对感知差别,可以通过计算两个颜色的( L*,a*,b*) 欧氏距离进行描述。
把像素的颜色用L*,a*和b*三元向量进行表示,则基于色度的图像梯度为
色度梯度的模值为
式中: ΔEx*与 ΔEy*为CIE - L*a*b*颜色空间的颜色欧氏距离,即
1. 4 亮度梯度与色度梯度融合
由于亮度梯度与色度梯度的数值范围并不相同,因此需要在融合过程中先将亮度梯度与色度梯度各自归一化
式中: max | ΔY | 与max | ΔC | 分别是图像中数值最大的亮度梯度与色度梯度。
由于亮度梯度域色度梯度同时满足线性变换,因此融合两者信息的梯度表示为
2 实验比较
将本文提出的基于亮度信息与色度信息融合的梯度,与单独的亮度梯度和色度梯度在多张图像上进行了比较。所测试的图片中既包括合成图像也包括自然图像。合成图像选择常用的彩色棋盘格图像。其中包含了三原色( 红色、绿色、蓝色) 、三原色互补色( 黄色、品红、青色) 以及黑色和白色8 种代表性颜色,按照不同的排列不同颜色彼此相邻。自然图像来源于公开的图像质量评价数据集[10]。
3 种梯度的结果图像如图1 所示。其中,图1a为原始RGB颜色空间图像以及利用本文方法梯度提取的结果; 图1b为亮度图像和亮度梯度的结果; 图1c为色度图像以及色度梯度的结果。需说明的是,为显示CIE -L*a*b*的色度图像,L*a*b*分量被对应到RGB分量中进行显示。因为a*、b*分量包含负值,因此在显示时,将CIE - L*a*b*颜色各分量统一在[0,255]内进行显示。
无论是亮度信息还是色度信息仅包含了人眼视觉系统的部分感知信息。因此其检测出的边缘并不全部是人眼感受到的边缘。其中,亮度边缘反映光照的分布特性和物体表面反射系数的分布,色度边缘则反映不同物体的位置分布以及同一物体材质的不同分布。
某些具有色度差异的物体,其对应的亮度可以十分接近。这时需要通过检测拍摄图像的色度梯度来分析场景中物体的分布与物体的结构。在图1 中,第1 幅原始图像白色黄色相邻区域、第2 幅原始图像中维尼熊的蓝色上衣与红色鞋子的边缘区域、第3 幅原始图像中红色鹦鹉的轮廓及翅膀红蓝羽毛的边缘、第4 幅原始图像中品红色帽子区域。在这种情况下,仅用亮度信息得到的梯度数值很小,与人眼视觉感受的边缘结构不一致。
另一方面,仅考虑色度信息无法反映场景中的光照特性和物体的表面反射特性。可以看到在第1 幅图中,某些颜色( 三原色之间、三原色互补色之间) 会有较强的色度梯度反映,其他颜色之间则色度梯度幅值并不强烈。在自然图像中,亮度差异明显的区域在色度分量中差异并不明显,如第2 幅图的球网区域、第4 幅图的蓝天白云区域。在这种情况下,仅利用色度信息无法提取完整的梯度信息。而本文提出的融合亮度与色度信息的梯度表示可以很好地将两个分量信息结合起来,产生更符合人眼感受的梯度结果。
3 总结
融合空间信息的彩色图像检索方法 篇9
1 相关工作及改进思路
本文提出了一种利用融合空间信息的彩色图像检索方法,先定义一个变量颜色粗糙度,它反映了图像中颜色在空间分布上的变化剧烈程度。当颜色变化比较剧烈时,选择较大维数的进行颜色量化,而当图像颜色在空间分布上变化较平缓时,选择维数较小进行颜色量化。算法根据粗糙度的不同采用分层处理的方法来进行图像匹配,当两幅图像的粗糙度在同一个变化范围内,由于生成的是相同维数的特征向量可直接采用欧式距离方法计算相似度,而对不同维数的向量采用一种改进的二次距离来计算。由于考虑了颜色在空间上的分布的变化程度,相对颜色直方图方法提高了检索精度,而相对颜色相关图法等来说速度有较大地提高,而且特别适合于检索空间关系不是非常相似的局部扭曲图像。
2 图像特征提取预处理
图像的颜色有多种表示方式,其中HSV空间是直方图最常用的,选择HSV颜色空间是因为它更接近于人们对颜色的主观认识。但是,由于人类色觉不能区分2nm范围内的色彩,所以当颜色变化较平缓、不明显时,人们较难区分时,传统的颜色量化方法,将色彩空间里的颜色按照统一的标准量化,这很难适应不同的检索要求。
为了克服上述缺点,我们希望能用一个量,来衡量整幅图像颜色在空间分布上的变化程度,当颜色变化较明显时,我们希望采用较小的颜色量化间隔,那么我们就能更好地区分不同的图像,而当图像变化较平缓时,我们希望减小量化维数,提高检索效率。所以,在这里引入一个颜色粗糙度的定义。
颜色粗糙度的定义:将图像平均分为M个个小块,在本文中我们将它分成(10*20块),假定每一个小块包含n个像素。每个小块图像的颜色均值为:Hm, m=0, 1,…,M-1。每个小块图像的颜色粗糙度为Sm, m=0, 1,…,M-1。它反映了当前小块中颜色变化的剧烈程度。而整幅图像的平均粗糙程度Savg来确定当前整幅图像颜色的变化程度。通过实验发现在HSV颜色空间中,求颜色的欧式距离时,为了简化运算提高处理速度,可以仅考虑色度(H分量),颜色粗糙度公式分别如下:其中hi表示小块图像内第i个像素的色度。
这样我们就可以通过图像的平均粗糙程度Savg来量化颜色空间,当Savg∈(0, 0.5]时,采用32维向量量化HSV颜色空间,当Savg∈ (1, 1.8],采用72维的向量量化HSV颜色空间,当,采用72维的向量量化HSV颜色空间,当Savg∈其它时,采用256维向量。
3 不同维数特征向量的构造
按人对颜色感知HSV空间进行32维,72维,166维,256维四种不同维数的非均匀量化。具体量化方法如下:
3.1 32维颜色特征向量的构造方法
1)对于亮度V<0.25的颜色认为是黑色。q32=0。
2)对于饱和度S<0.2的颜色按其亮度V[0.25, 1.0],均匀量化成三种灰度。分别为:深灰,浅灰和白色q32=1, 2, 3。
3)其它颜色认为是彩色,对色度H[0, 360]量化为7个区间(330, 20), (20, 45), (45, 75), (75, 165), (165, 200), (200, 270), (270, 330), h的取值分别为0, 1, 2, 3, 4, 5, 6代表红,橙,黄,绿,青,蓝,紫;对于饱和度S量化为:淡色(0.1, 0.45)和深色(0.45, 1.0)分别取值为s=0, 1;对于亮度V量化为暗色(0.2, 0.5)和明色(0.5, 1.0)分别取值为v=0, 1。将这些颜色量化为28种彩色。q32=4+4*h+2*s+v。
3.2 72维颜色特征向量的构造方法
1)对色度H[0, 360]非均匀量化为8个区间:(315, 20), (20, 45) , (45, 75) , (75, 155) , (155, 190) , (190, 270) , (270, 295) , (290, 315) , h分别取值为:0, 1, 2, 3, 4, 5, 6, 7
2)对于饱和度S量化为3个V:间:(0, 0.2), (0.2, 0.7), (0.7, 1), s分别取值为0, 1, 2
3)对于亮度V量化为3个区间:(0, 0.2), (0.2, 0.7), (0.7, 1), v分别取值为0, 1, 2
4)颜色代号为:q72=9h+3s+v
3.3 166维特征向量的构造方法
对HSV空间进行非均匀量化得到166种代表颜色,具体颜色量化和编码如下:
1)对于亮度V<0.25的颜色均归入黑色,其编码为q166=0。
2)对于饱和度S<0.20且V>=0.25的颜色按亮度v值均匀量化成三个值,分别为深灰、浅灰、白色,其对应的编码分别为:q166=1, 2, 3。
3)其它的颜色(S>=0.20且V>=0.25)则认为是彩色,将色度H∈[0, 360]均匀量化成18个值,对应取值h=0, 1,…,17;饱和度S∈[0.20, 1.0]均匀量化成3个值,对应取值s=0, 1, 2,亮度V∈[0.25, 1]均匀量化成3个值,对应取值v=0, 1, 2,这样共得到162种彩色,其编码分别为:q166=9*h+3*s+v+4。
这样HSV颜色空间中的全部颜色都被量化到了[0, 165]中,图像中的每个像素颜色的值q166都可用这个区间中的数字编码表示。
3.4 256维特征向量的构造方法
1)对色度区间H[0, 360]量化为16个区间:(345, 15), (15, 25), (25, 55), (55, 80), (80, 108), (108, 140), (140, 165), (165, 190), (190, 220), (220, 255), (255, 275), (275, 290), (290316同),(316, 330), (330, 345), h分别取值为0, 1, 2, 3,…,15。
2)对于饱和度S量化为4个区间:(0, 0.15), (0.15, 0.4), (0.4.0.75), (0.75, 1), s分别取值为0, 1, 2, 3。
3)对于亮度V量化为4个区间:(0, 0.15), (0.15, 0.4), (0.4, 0.75), (0.75, 1), v分别取值为0, 1, 2, 3。
4)颜色代号为:q256=16h+4s+v。
4 特征向量的相似性度量方法
相似性度量是为了比较特征向量之间的匹配程度,是图像检索必不可少的工具。由于在特征向量的提取过程中,所以生成的特征向量的维数可能有所不同,在进行相似性度量时会出现两种情况:
4.1 相同维数特征向量相似性度量
目前相同维特征向量的相似性度量方法有很多种。比较常用的有直方图相交法、欧氏距离法等。本文采用欧式距离,进行相同维数特征向量相似性度量。欧氏距离法:
Q-查询图像,D-数据库图像,L为将HSV颜色空间量化成L种颜色,HQ (i) 表示查询图像中第i种颜色像素点占全部像素点的百分比。
4.2 不同维数特征向量相似性度量
由于每幅图像经特征提取后的特征维数可能不同,给相似性度量带来了困难.可采用扩展的直方图二次型加权求距离的方法,解决了不同维数时颜色特征的相似性计算设两图像D, Q,假定两幅图像特征向量分别有a维和b维,当a≠b时,将两个特征向量各自分别扩展,使它们的维数相同.经过推导,可以得到相应的二次型公式:
其中,Pq是查询图像向量,Pd是数据库中图像的向量。S矩阵是间相似性度量矩阵,每个特征向量元素Sij是一个向量的第i个颜色区间Ci和第二个向量的第j个颜色区间Cj之间的相似性,定义为:
其中min (Ci, Cj) 为两个区间中较小的一个;max (Ci, Cj) 为两个区间中较大的一个;Ci∪Cj为两个区间的并运算,得到运算结果包含两个区间;Ci∩Cj为两个区间的交集,得到运算结果包含两个区间的公共部分;||||为区间的长度;Ci=Cj是指两个区间相同;Ci∈Cj表示区间Ci是Cj区间的子集。
5 融合空间信息的图像检索算法
步1:将图像中每个像素点进行从RGB颜色空间到HSV颜色空间的转换.;步2:计算查询图像Q的平均颜色粗糙程度计算Savg Q=|Savg Q-Savg D|,Savg D|为数据库图像D的颜色粗糙程度比较。当Savg>a时则判定两幅图像差距过大,不进行相似性比较,直接与下一幅数据库图像比较;否则转步3。(其中a为差距阀值);步3:将查询图像Q用与数据库中特征向量维数相同的图像D利用公式(4)进行相似性度量,计算两者之间的相似性距离distQD,当时distQD≤β则认为两幅图像相似,标记这幅图像,否则,直接与下一幅数据库图像进行比较;步4:搜索完数据库中全部图像,当所搜索到的图像达到用户要求的图像数目时,算法终止。否则,我们对图像库进行二次搜索,这次只比较与查询图像特征向量维数不同的情况,由于两幅图像的量化维数不同,用公式(5)进行相似性度量,找出与所查询图像距离最近的图像,原来的查询结果加上这次查询结果为最终的结果。
6 实验结果
图像检索系统有两个主要的评价指标,即查准率(Precision)和查全率(Recall)。查准率和查全率越高,说明该算法的检索效果越好。
公式中各变量参见表1:
为了检验上述算法的准确性和效率,笔者进行了基于内容的图像检索实验。使用的宾夕法尼亚州大学图像数据库(http://wang.ist.ps u.e du/docs/re late d/)中的内容包括1000张图片,从中选择蝴蝶、马、鸟类、树林、风景等,随机取图片共300张图片。分别采用三种方法进行查询以便比较性能:
1)采用HSV颜色空间直方图方法,其度量距离为欧式距离(简称HSV)。2)采用本文提出融合空间信息的图像检索算法(简称HSVH)。3)采用颜色相关图法来检索(简称COR)。
图1、图2、图3是分别用HSV、HSVH方法检索相同的蝴蝶时返回给用户的前20幅图像的检索结果。左上角的第一幅图像即是查询图像。在确定的样图下,对库中的每一图像,人工找出库中与样图颜色相类似的图像.图4是分别采用HSV、HSVH、COR方法检索,并得到相应的查全率/查准率曲线,我们将查全率/查准率全部乘以100,量化到0~100的范围。
7 结束语
从实验结果可以看出,采用这三种方法时,相同图像检索的结果不一致,用HSVH和COR方法检索性能优于用HSV方法。前两种方法由于考虑了颜色的空间分布比传统颜色直方图HSV方法明显地提高了检索精度。而本文提出的HSVH方法与COR方法相比,检索精度相关无几。而在检索速度上,COR方法检索时间复杂性(O (m2d))较高,HSVH方法考虑了颜色在空间上的分布情况,采用分层检索方法预先筛掉了一些与查询图像颜色粗糙度相差较大的图像,较大地提高了图像检索的速度,速度接近于HSV方法,特别是当图像数据库中图像的数量增大时,该算法的效率提高得更加明显。
摘要:彩色图像检索方法基于HSV颜色模型提取示例图像的颜色特征与图像库中图像的颜色特征时, 提取不同维数的特征向量。在图像相似性度量的时候使用不同的计算公式。实验结果证明, 这种颜色直方图算法速度快且与人类的视觉有着良好的一致性。
关键词:基于内容的图像检索,特征向量,颜色量化,颜色粗糙度,相似性度量
参考文献
[1]刘忠伟, 章毓晋.用颜色和纹理特征的图像检索[J].通信学报, 1999.
基于文本的网络图像信息搜索技术 篇10
关键词:文本搜索,网络图像信息,搜索技术
在当今社会的网络信息存储中, 图像方面的信息占据了越来越重的比例, 根据之前的调查表明, 互联网上有80%的信息都来源于图像, 网民们对于图像的搜索需求越来越高。就目前的技术来看, 图像的搜索技术主要是基于文本和基于图像内容两种方法。在这两种技术方法中, 基于文本的网络图像搜索技术的不断发展, 更加符合绝大多数人的搜索习惯, 对于关键字的描述也相对准确。
1 基于文本的图像检索技术
1.1 什么是基于文本的图像搜索技术
基于文本的图像搜索, 就是指在收集图像的时候, 把这个图像周围的文本也一同收集了起来, 或是在搜索过程中, 图像中存在的文本被识别出来, 作为对于该图像的定量描述。基于文本的图像检索也就是通过关键字来进行图像检索, 非常地简便并且易于实现。
1.2 基于文本的图像检索技术索引数据库的建立
在基于文本的图像搜索技术中, 最关键要素就是索引数据库的建立。建立起这个索引数据库, 首先就要提取出跟图像的所有有关的信息, 比如图像的格式、名称和尺寸等。
1.3 基于文本的图像搜素技术的特点
根据当前的事情来分析, 基于文本的搜索存在着两方面的困难:一方面就是通过文本上的描述并不能准确表达图像的全部内容, 因为文字的描述能力有限, 它只能是通过定向的词语或句式来表达。一旦图像中出现了类似不规则形状或不常见的纹理时, 就很难应用文本对其进行解释。再有就是通过文本描述离不开会出现主观因素的形象, 当图像的内容过于丰富, 就会使内容上的描述具有很大的主观性, 那么这样的搜索方法会出现歧义。
但是基于文本的图像搜素技术也有很多优点, 比如说可以把图像的搜索转为了与图像相适应相符合的文本检索, 这样更加利于实现。另一方面, 由于文本搜索是人工来控制操作的, 所以它的查准率非常高, 可以用来辅助其他图像的搜索技术。
2 如何用文本的方法对图像进行搜索
2.1 图像关联文本的选取
基于文本的图像搜索, 其实就是找到与这个图像有关连的文本, 来对图像进行索引和标注。跟图像有关联的文本主要包括了文件的拓展名和超文本文件的图像标记符号。文件的拓展名就是图片的存储格式, 常见的有gif.、jpg.等, 根据这些文件的拓展名, 我们可以很好地定位图像信息。而超文本文件的图像标记符号其实就是让我们在实际的搜索中应用到超文本标记语言和可拓展标记语言。
2.2 文本匹配技术
当一个需要被搜索的图像里所有的文本都提取出来时, 就要根据这些文本的特征进行排序。不同的排序标准往往会出现不同的搜索结果, 比如根据图片的类型来进行文本搜索, 那么我们可能会搜索出特定的图片, 但如果是根据这个图片的内容在网站中进行搜索, 那么搜索的范围也会缩小。
3 如何对图像中的文字进行提取
3.1 基于文本区域空间频率特征的纹理方法
基于文本区域空间频率特征的纹理方法, 又称为纹理图像分割法。主要是采取了平稳离散的小波变换来对图像进行着分解, 由于纹理图像在局部的区域内是呈现不规则性, 但在整体中又表现出了规律性, 因此可以对其进行分割。这样的方法可以准确检测到字符与背景的对比度较小的文本, 但是也有一定的缺点:由于它产生的文本区域常常和附近的其他边缘轮廓相互黏接, 所以说不能得到文本区域的精确位置。
3.2 连通区域方法
根据图像进行连通区域的方法可以有效确定出文本区域的精确位置和大小, 但和基于文本区域空间频率特征的纹理方法相反的是, 它不能够检测到字符与背景的对比度较小的文本, 因此也有着自身的约束性。
3.3 神经网络方法
由于区域空间纹理法和连通区域法都有着自身的局限性, 所以提出了一种新的方法——神经网络方法。这种方法将纹理法和连通区域法进行了巧妙的融合, 通过整幅的彩色图像色调的直方图来对图像的颜色进行分类, 当字符和背景的对比度较小时, 根据图像中的其他像素颜色, 文本和背景的颜色就会在神经网络中形成一个绝大值。在实际的搜索中, 会用纹理法将图像分隔成一个个可能会包含着文本的图像块, 然后用区域法来确定文本的大小和具体位置。
神经网络的方法改进了纹理法和连通区域法中存在的不足, 是目前为止应用最为广泛的图像中文字的提取方法。
4 结论
其实基于文本来对图像进行搜索, 从根本上说就是利用文本的特征来准确搜索到图像, 在这里文本就是起到了桥梁的作用。在今后的生活中, 互联网将会是一个多媒体的网络, 除了文字外, 图像、音频、视频都在扮演着越来越重要的角色。随着基于文本的图像搜索技术发展水平越来越高, 也有着非常大的现实意义。但是技术的发展并不是一朝一夕可以完成的, 在现阶段的搜索技术力还有这很多问题, 显得不够成熟, 我们应该通过分析文本的图像搜索技术的优点和不足, 找出今后的发展方向, 推动检索技术更加成熟化发展, 给人们创造出更多的价值。
参考文献
[1]赖庆.基于文本的网络图像信息搜索技术[J].民营科技, 2008, (11) :30-32
[2]王占一, 徐蔚然, 郭军.智能文本搜索新技术[J].智能系统学报, 2012, (01) :40-49.
[3]阿斯艳·哈米提, 阿不都热西提·哈米提.基于文本的图像检索与基于内容的图像检索技术的比较研究[J].首都师范大学学报 (自然科学版) , 2012, (04) :6-9.
[4]韩泉叶, 杨晓健.文本信息搜索模型研究[J].兰州铁道学院学报, 2002, (01) :27-29.
图像信息 篇11
关键词 摄影图像 信息 网络传播 视觉
中图分类号:TP393 文献标识码:A
21世纪是读图的时代,摄影作为视觉符号,在视觉经验的传播中占有重要的地位和极大的影响力。摄影“信息说”的观念与数字化之间有着密切的关联,其特点便是非线性记录与二维性传播。“所谓非线性记录,是指照片信息的获得,不像文字信息那样依先后次序逻辑地输入,而是在短暂瞬间以光化学方式整体录入,大量信息交叉、并列、综合地包含于照片平面形象中。而传播与解读时,也会以平面二维方式进行,信息有效与无效、排列与组合都允许多种选择,形成多种结果。”
1传播媒介——网络
网络是信息产业和传媒产业的结合体。网络发展极速,直接渗透到人类生活的方方面面,这使得传播领域发生了根本性的变革。Internet(互联网)作为冷战时期的产物,其诞生给全人类的生活开创了新纪元。
网络的快速普及与应用,除了信息容量大、传播速度快、互动性强这三大主要因素之外,还有一个非常重要的原因,就是依据网络使用者对互联网这一媒介的使用需求。正如美国心理学家、人本主义心理学创始人马斯洛在1943年提出的“人类需要的层次论”一说,他将其分为:生理的需要、安全的需要、爱与隶属的需要、尊重的需要、自我实现的需要,五个层次。并在两年之后,又扩展了两个层次,即求知与求美的需要。并且根据20世纪40年代,对报纸、广播以及电视等各种媒介的研究表明,“人们接触媒介都是基于一些基本需求进行的,包括信息需求、娱乐需求、社会关系需求以及精神和心理需求等。”因此,网络作为新兴发展起来的传播媒介,也不会例外。虽然,从本质上来讲,马斯洛的这以理论并不能等同于人类对网络的需要,但也不失为一个有力的分析及参考依据。
如今,我们这个时代多以媒介为扩张中介,对信息进行大量而广泛的传播。与传统传播媒介不同的是,网络不仅仅是单一的传播媒介,它还是将人际传播、群体传播、组织传播融为一体的大众传播媒介。网络这一媒介让我们真正体验到了“足不出户便知天下事”的便捷与乐趣。正因如此,网络已经成为了全球人类社会活动中必不可少的一部分。
2视觉信息——摄影图像
由于网络的普及和影响,随之摄影技术的不断提高,所以摄影图像也如同文字一样,在网络传播中得到了广泛的认可与运用。与文字相比较,摄影图像作为更具视感性的视觉语言,包含了更丰富的多样性和形式的多元化。摄影技术作为一种保留视觉信息的科学技术,大大改变了人类的思维模式、判断依据、研究方法和审美观念。而且,作为摄影本身,它具有极强的特性,大体概括为三种,即社会性、视感性和复制性。
其中,摄影的“视感性”又恰好说明,无论如何,它都不能脱离开视觉的直观感受。摄影图像不仅仅是现场光学信息的记录,它所反映和传播出的信息超越了文字信息带给人的意义。文字信息只能是人类通过后天的学习与接收,在视觉产生后形成的逻辑推理或概念系统的整合。而摄影图像,可以通过眼睛刺激起人的各种感官体验。“从哲学意义上讲,摄影图像具有与语言、文字同样重要的文化意义。因为图像可以作为人们观察世界、认识世界的一种根本性媒介,用来思考和体证物质世界和人类本身。”
摄影图像作为传播内容,在网络这样的传播载体中,将信息更加有效快速的传递到人类视觉接收的过程里,从而更直观、迅速,感受也更为饱满。在网络中,人们可以从摄影图像中获取信息,也可以通過摄影图像交流信息和提高审美意趣。
3以LOFTER网易轻博客里的摄影图像为例
LOFTER是网易2011年8月下旬推出的一款轻博客产品,于2011年12月1日公开注册,网址:www.lofter.com,口号为“专注兴趣,分享创作”,其中特别专注于为用户提供简约、易用、有品质、重原创的博客工具及原创社区,受到了互联网中众多文艺青年、摄影师、插画师的热爱。在这里需要特别指出的是这款轻博客的其中一个定位是:“注重原创”。因此,在这样一个高品质的网络分享与交流学习的平台中,博主自己独立拍摄的图像被发布传播到互联网上,并被其他博主浏览到的过程里,实现如信息需要、自我实现的需要及心理需要等。
例如,LOFTER对其登陆界面,有非常特别的设计,且富有创意,因为博主登陆界面的背景可以是自己的摄影作品等。LOFTER这一举措,对于博主在网络中发布传播自己的摄影图像给予了极大的肯定与支持,大大增强了博主们的活跃度和积极性。
4总结
如今,随着人类社会步入到了读图时代和网络的迅速传播,摄影图像已经逐渐成为了一种大众化的信息交流形式,并且有一定的社会性和艺术性。对于人类之间传递信息和感情的诉求,摄影图像提供了更为直接的表达方式。相信在未来的发展中,还会对人类的精神文明产生更多的影响。
参考文献
[1] 李文方,等.摄影艺术导论[M].沈阳:辽宁美术出版社,2013.
网络信息检索中的图像检索技术 篇12
基于文本的检索是搜索引擎将网站、网页的内容索引为一系列的关键字, 当用户输入相应关键字后, 系统根据数据库中的倒排文档将关键字映射为网站或网页的地址。图像信息基于文本的检索技术, 即根据图像信息的文件名、路径名、ALT标签等, 将其标注为一系列关键字的描述, 然后通过检索这些描述以达到检索图像信息的目的。这种检索技术很不实用。首先, 由于目前的计算机视觉和人工智能技术都无法自动对图像进行标注, 要由人工完整地标注网络上的所有图像, 不但费时费力, 而且往往是不准确或不完整的;其次, 不同用户对于同一张图像的看法不尽相同, 导致对图像的标注没有一个统一标准;再次, 这种方法将注意力局限在图像的著录特征, 即文字描述上, 不能充分揭示和描述图像中有代表性的画面内容特征。所以基于内容的图像检索技术应用而生。
1 基于内容的图像检索技术
基于内容的图像检索一般是指静止图像的检索。这种图像检索技术通过分析图像的内容, 提取其颜色、形状、纹理等可视特征, 建立特征索引存储于特征库中, 在检索时, 用户只需把自己对图像的模糊印象描述出来 (绘制的草图或通过扫描仪等在线输入的图像) , 就可以通过多次的近似匹配, 在大容量图像库中查询到所需图像。基于内容的图像检索具有较强的客观性。
基于内容的图像检索算法涉及的相关技术比较多, 主要有:图像的分析与特征向量的提取技术、特征向量数据的组织与存储技术、图像数据的组织与存储技术等。
1.1 基于颜色特征的图像检索
颜色特征是图像检索中最基础的一种检索依据, 颜色是人识别图像的主要感知特征之一。在基于颜色特征的检索算法中, 通常用颜色直方图来表示图像的颜色特征。直方图能较好地反映图像中各颜色的频率分布, 横轴表示颜色等级, 纵轴表示在一个颜色等级上, 具有该颜色的像素在整幅图像中所占的比例。直方图可以对整幅图像进行最大匹配度检索。目前关于色彩的索引方法有两类:基于全局色彩的索引与基于局部色彩的索引。
全局色彩的索引就是按全局色彩的分布来索引图像, 计算每种颜色的像素, 检索出具有相同颜色内容的像素的图像。其中最为简单有用的工具是灰度直方图。利用图像的灰度直方图作为特征指标来描述图像, 一般是利用二维直方图, 如红—蓝直方图, 它是红光图像的灰度值和蓝光图像的灰度值的函数。利用色彩直方图进行检索的方法有许多, 如:比例直方图法、累加直方图法等。
色彩直方图还不能为像素在图像中的位置提供线索, 为了尽可能少地丢失信息, 提出了局部色彩方法。局部色彩的索引对象是局部相似的颜色区域, 它考虑了颜色的分类和一些初级的颜色特征。用形状面积、圆度、离心率等来描述形状的特征矢量。
1.2 基于形状特征的检索
形状是刻划物体的本质特征之一, 利用形状来检索可提高检索的准确性和效率。基于形状的检索不仅包括传统意义的基于二维形状的检索, 还包括三维形状的检索。
基于图像内物体形状的检索, 首要问题是采用合适的图像分割算法把不同对象从图像中分割出来, 关键是寻找符合人眼感知特性的形状特征。目前, 较好的方法是采用图像的自动分割方法结合识别目标的前景和背景模型来得到比较精确的形状特征。图像自动分割方法的具体思路是:将图像分块后, 将每个块看成是一幅小图像, 计算每个小图像的颜色直方图特征, 则每个块间的直方图是不一样的, 为分析边缘特征, 将相邻两个块构成一个比较对, 将每个块间的差值记录下来, 同时记录差值在一定范围内的数目, 这样就形成一个颜色特征差值表。图像对象空间位置发生变化, 其特征差值表也就不同。
1.3 基于纹理特征的检索
纹理是指图像在局部区域内可能呈现出不规则性而在整体上却表现出某种规律性。纹理特征是图像中难以描述的特征, 它是一种反映图像像素灰度级空间分布的属性。如果一个物体内部以灰度级变化明显而又不是简单的色调变化, 那么该物体就有纹理。
纹理分析的方法基本可以分为统计法、结构法、模型法和空间法/频率域联合分析法等4类。基于统计的方法是对图像中的颜色强度的空间分布信息进行统计, 主要用于分析像木纹、沙地、草坪等细致而不规则的物体;基于结构的方法将重点放在分析纹理元之间的相互关系和排列规则上, 适用于像布料或砖瓦等一类元素组成的纹理以及排列比较规则的物体;基于模型的方法是假设纹理按某种类型分布, 如Markov随机场模型、分形模型等。基于空间/频率域联合分析法主要包括Cabor变换法和小波变换法等。
1.4 基于知识的图像检索
基于知识的图像检索也是基于内容检索的重要方法之一。图像本身是一定数量的颜色像素点的集合, 人类能够识别出像素点集合的含义是人类以自身的知识赋予图像意义的过程。基于知识的图像检索系统为用户提供知识库, 针对一个图像需求, 搜索引擎依次调入每一幅图像的内容描述, 结合知识库中的相关知识, 以图像需求为目标进行推理, 如果需求目标得到满足, 则确定这幅图像符合检索要求。
2 基于内容的图像信息检索系统
目前, 基于内容的图像检索技术的研究取得了很大的突破, 较有影响力的有以下几个:
2.1 QBIC系统
QBIC (Query By Image Content) 是IBM公司于20世纪90年代研制的图像和动态影像检索系统, 其含意是“根据图像的内容进行查询”。由IBM Almaden研究中心开发, 是基于内容的检索系统的典型代表。QBIC在检索过程中用户无须提供文字检索词 (它也提供关键词检索) , 只要输入以图像形式表达的检索要求, 即可检索出一系列相似的图像。QBIC系统允许使用示例图像、用户构建的草图、选择的颜色与纹理模式、镜头与目标运动等, 对大型图像和视频数据库进行查询。
2.2 Photobook系统
Photobook系统是由美国麻省理工学院 (MIT) 的媒体实验室于1994年开发研制的用于浏览和搜索图像的一套交互式工具, 图像在存储时按人脸、形状或纹理特性自动分类, 图像根据类别通过显著语义特征压缩编码。
2.3 Virage系统
Virage是由Virage公司开发的基于内容的图像搜索引擎。与QBIC相似, Virage支持基于颜色、颜色布局、纹理和结构 (对象边界信息) 的可视化查询, 但Virage比QBIC更进一步, 它也支持由4个原子查询的任意组合, 用户可以根据他们自己的侧重调整4个原子查询的权重。
2.4 CORE系统
CORE是新加坡国立大学开发的一个基于内容的检索系统。其显著的技术特色包括:多种特征提取方法、多种基于内容检索方法、使用自组织神经网络对复杂特征度量、建立基于内容索引的新方法以及对多媒体信息进行模糊检索的新技术。
2.5 Visual SEEK系统
由美国哥伦比亚大学图像和高级电视实验室开发。它实现了互联网上基于内容的图像/视频检索系统, 提供了一套工具供人们在Web上检索图像和视频信息。用户可以把顶部为红橙黄色区域、底部为蓝绿色区域, 这样的图像作为查询“日出”的草图, 使人们在Web上可以方便地搜索和检索图像和视频。
3 基于内容的图像检索体系结构
基于内容的图像检索系统与传统基于文本的检索系统完全不同。基于内容的检索系统一般通过可视化界面和用户进行频繁的交互, 以便用户能够方便地构造查询和改进检索结果, 用户通过选择具有代表性的一幅或多幅例子图像来构造查询, 然后由系统查找与例子图像在视觉内容上较相似的图像, 按相似度大小排列返回给用户, 即所谓的通过例子图像的检索 (Query By
Image Example) 。
基于内容的图像查询和检索是一个逐步求精的循环过程。其过程及各个模块如下:
3.1 图像的预处理
在特征抽象子模块里, 首先要进行图像的预处理, 包括图像格式的转换, 尺寸的统一, 图像的增强与去噪, 图像的边缘提取, 经过边缘提取获得图像的轮廓特征, 对其进行进一步轮廓清晰化处理等功能, 为图像的特征提取打下基础。
3.2 图像的目标标识
图像预处理后, 要进行图像的目标标识。目标标识为用户提供一种工具, 以全自动或半自动 (需要用户干预) 的方式标识图像中用户感兴趣的区域或目标对象, 以便针对目标进行特征提取并查询。当进行整体内容检索时, 利用全局特征, 这时不用目标标识功能。目标标识是可选的。
3.3 图像的特征提取与表达
图像特征的提取与表达是基于内容的图像检索技术的基础。对图像数据库进行特征提取, 提取用户感兴趣的、适合检索要求的特征。特征提取可以是全局性的, 即整幅图像, 也可以是针对某个目标的, 即图像中的子区域, 如人的面部特征或指纹特征等。
3.4 图像数据库
作为图像查询的后台基地, 生成的数据库由图像库、特征库和知识库组成。图像库为数字化的图像信息, 特征库包含用户输入的特征和预处理自动提取的内容特征。知识库包含专门和通用知识, 有利于查询优化和快速匹配, 知识库中知识表达可以更换以适用各种不同的应用领域。
3.5 图像的查询接口
在基于内容检索中, 由于特征值为高维向量, 不具有直观性, 因此必须为其提供一个可视化的输入手段。友好的人机交互界面是一个成功检索系统不可缺少的条件, 可采用的方式有3种:操纵交互输入方式、模板选择输入方式和用户提交特征样板的输入方式。另外, 查询返回的结果需要浏览, 应在用户界面提供浏览功能。
3.6 图像的检索引擎
检索是利用特征之间的距离函数进行相似性匹配, 模仿人的认知过程, 近似得到数据库的认知排队, 存在一些不同的相似性测度算法, 检索引擎中包括一个较为有效可靠的相似性测度函数集。
3.7 图像的索引/过滤
索引是用来提供快速、有选择性地存取数据库的一种机制, 它相当于一种映射机制, 将属性的值转换为相应数据地址域的地址集。过滤器作用于全部数据, 过滤出的数据集合再用高维特征匹配来检索。索引用于低维特征, 可以用R树来索引以加快检索速度。
基于内容的图像检索技术为用户提供了一个在网络上搜索感兴趣的图像信息资源的有效手段, 但基于内容的图像检索技术目前还存在许多有待发掘的内容, 因而, 基于内容的图像检索技术也需要随着网络技术、信息技术的发展而发展。
摘要:图像检索是网络信息检索中的重要的组成部分, 而其检索技术却相对滞后。基于内容的图像检索已成为网络信息检索技术的研究热点。本文分析并总结了图像检索的概念, 综述了基于内容的图像检索系统和相关技术。
关键词:网络信息检索,基于内容,图像检索技术
参考文献
[1]何惠芬.图书馆中基于内容的图像数据库检索技术[J].情报杂志, 2002 (7) .