训练图像

2024-09-15

训练图像(精选5篇)

训练图像 篇1

摘要:地理图像的视角是指观察和分析地理图像的角度, 它引导学生不仅能看到图像上直观的东西, 而且能“看”到哪些图像上隐含的内容。

关键词:地理图像的视角,特征,训练

地理图像的视角其特征为:1.个体的差异性:对于同一信息源 (图像) 每个学生所获得的信息各不相同, 有的学生只能看到图像中那些“表现明显”的部分。而有的学生则善于从不同的视觉角度观察图像的组成要素, 和它们之间的相互关系, 获得更多的有价值的图像信息。2.观察的有序性:学生在观察图像时, 视角的注意点从一部分向其他部分转移时是有一定规律的, 通常是根据不同要求:由主到次、由点到面或按时间、方位、关系有序的观察, 这种不重复、不遗漏的视图方法使获取的信息更完整。3.读图的选择性:通过各种符号、注记表示地理事物的图像, 所涵盖的内容丰富、涉及面广。有时学生对图像经过反复观察也不得要领, 其症结是不善于把看到的东西进行筛选, 排除与主题不相关的非本质内容。只有抓住图像的关健点, 才能使获得的信息更具有针对性。4.视图的还原性:将抽象的图像符号还原成真实的地理事物过程。要善于依据“色彩缤纷”的符号, 将平面的等高线地形图转化成“大脑”中的立体形态, 实现等高线地形图与实际地形的逆向结合。5.内涵的隐藏性:通过对图像的观察和分析, 能容易地读出它所表达的城市、村庄、道路、山地、高原等地理事物, 判读这些“外在”的内容, 只能视作理解图像的第一步。只有进一步揭示其内在的本质属性, 才能看到一切不在图像上的“东西”, 才能培养学生“由表及里”的析图方法, 也才能形成独特的图像视角。

依据图像视觉的特征来判读图像, 并形成个体独特的图像视角, 其实质是图像思维的训练过程。下面按照学生的思维认知程序, 探究图像视角的训练过程:

一、读图训练

养成学生正确的读图程序, 并根据读图要求, 排除不相关的图像因素, 把目标从图像的背景中分离出来, 获取有用的信息。为此, 一要搞清图像的基本构成要素, 如地图上的各种注记、图例、颜色、比例尺、经纬网、等值线等, 这是学习地图的前提, 学生掌握这些图像语言的地理意义, 才能为进一步学习打下基础。其次根据图像所表述的地理事物及读图要求, 对图像中的各种符号加以分析, 使之具体化、形象化。题例1:以“中国行政区简图”为例 (图略) :从地图名称入手, 了解地图各种图例的含义及比例尺的大小, 突出地图的主题 (行政区) 。其次, 引导学生有序地读图, 如按方位 (西南地区主要包括哪几个省级行政区?...) 、按面积 (我国面积最大的省级行政区?最小的呢?...) 、还可按人口、按地形等观察顺序。同时注意分析与行政区相关的其它内容:如我国人口集中分布的地区;陆上邻国按顺时针分别有哪些;我国领土最南端在哪里等。还要根据读图要求, 选取重点, 使学生读图有主、查图有法。

二、成像训练

图像能把抽象的文字变成直观的有一定空间位置的图形, 通过对图像表象的理解、扩大、迁移、深化达到想像和再造想像, 使图像信息在头脑中保留和再现, 实现学生没有看到图像, 也可以凭借这种“心理地图”形成图像, 分析和解决相关的地理问题。题例2:“世界主要煤田的分布“ (图略) , 阅读煤田空间分布状况, 获取地理表象知识。然后根据表象提供的“充足原料”, 经过抽象的思维加工, 简化繁杂的煤田分布状况, 化难为易, 变具体为抽象, 在头脑中构建世界两大主要煤带:北半球的亚欧大陆煤带和北美洲中部煤带, 把形象思维和抽象思维巧妙结合“成像”。由于图像的信息化比文字的信息化更易记忆和展现, 因而使理论知识的透明度提高, 难度降低。通过有意识的引导学生读图、记图, 将一幅幅图像不断的输入, 逐渐形成大脑的图像系统。

以图成像, 培养了学生的抽象思维能力。成像训练使学生能够透视隐藏在图像内部的性质和规律, 让学生看的更深入, 获得的信息更丰富。成像训练的目的不在于记住某一幅图, 而重要的是提高他们的思维品质。

三、释图训练

图像视角的培养, 不仅是读图、“成像”, 更重要做到图-文、图-图的转换, 如将课本文字转化为图像, 用直观的图像方式来表达教材中的文字内容, 或者能够用一幅地图来阐述表达另一幅地图, 或者对某一幅图像进行变式处理等等。题例3:在教学“季风对我国夏季降水产生影响”的内容时, 可采用以图释文的训练方式:运用我国5、6、7-8、9月四幅东部地区主要雨带图 (图略) , 形象反映我国季风的范围、时间、强度, 既降低了知识的难度, 又便于学生深刻的理解我国东部夏季降水形成的原因、类型及降水量的区域差异, 同时也揭示诸如梅雨、旱涝灾害的成因。

图像的转换是提高释图训练效果的有效手段, 让学生在探索中了解各种图像的变式, 并通过对图像“基本结构”的改变, 从不同侧面揭示图像的地理内涵。

训练图像 篇2

使用日期:2013-4-10

备课人: 徐祥胜

审核人: 王志广

正比例的图像

【学习目标】

1、明确正比例图像的特征。

2、能绘制正比例的图像。

3、借助正比例图像解决相关的问题。

【学习过程】

一、板书课题

师:同学们,今天我们来学习“正比例的图像”(板书课题)。

二、出示目标

本节课我们的目标是:(出示)

4、明确正比例图像的特征。

5、能绘制正比例的图像。

6、借助正比例图像解决相关的问题。师:为了达到目标,下面请大家认真地看书。

三、出示自学指导

认真看课本第63页例2上面的内容,看图、看文字回答例题中的几个问题并思考:

1、说出图中各点表示的意义?()小时行()千米。

2、图中的点在一条直线上吗?

3、任意描一点说出时间与路程的对应关系?

5分钟后,比谁能做对检测题!

四、先学

(一)看书

学生认真看书,教师巡视,督促人人都在认真地看书。

(二)检测(课本第64页的“练一练”)

1、找两名学生板演,其余生做在练习本上

2、教师认真巡视,发现错例,板书于黑板上对应位置。

五、后教

(一)更正

师:写完的同学请举手。下面,请大家一起看黑板上这些题,发现问题的同学请举手。(由差-中-好)

(二)讨论

1、看第一问,认为对的举手。为什么?数量÷时间=速度(一定)。

2、看第三问,认为对的举手。为什么?

3、追问:正比例关系的图像是什么样?

4、正比例关系的判断还有怎么方法?

5、评正确率、板书,并让生改错。

六、练一练

序号:35

使用日期:2013-4-10

备课人: 徐祥胜

审核人: 王志广

课本第67页练一练。

下面,我们就来运用今天所学的知识来做作业,比谁的课堂作业能做得又对又快,字体又端正。

训练图像 篇3

图像从形成、传播到最终显示的过程中容易受到各种干扰,影响图像质量,比如在传输过程可能受到高斯白噪声的影响、图像在初始成像时容易受到椒盐噪声的干扰等。因此,为了提高图像质量,还需对图像进行降噪处理。

Donoho等人利用小波变换的方法[1,2],将图像数据转换到小波域,由于噪声往往处于高频,因此小波域中的噪声系数较小,所以可以通过设置阈值的方法将噪声的小波系数置零去噪,小波图像降噪取得了较好的效果。Buades提出了具有重要意义的非局部均值去噪方法[3,4],该方法先是寻找图像中的相似的图像块,然后对这些相似的图像块进行平均化处理,以达到去除噪声的目的。由于该方法良好的降噪性能,之后出现了许多改进的方法,文献[5]提出了采用相关系数衡量图像块的相似度,增加了图像块之间的相似性,去噪效果比非局部均值去噪方法有所提高。文献[6]则是采用多尺度匹配的方法来描述图像块的相似度,增强了算法在复杂结构图像寻找相似图像块的能力,因而提升了降噪性能。

Dabov等人根据非局部均值算法中相似图像块的思想[7,8],提出了基于块匹配的三维协同滤波降噪算法(Block-Matching and 3D filtering,BM3D)。该算法的第一步是根据图像中的一个参考图像块寻找相似的图像块,之后将这些相似图像块组成三维矩阵,变换到小波域进行阈值处理,还原后的图像作为基础估计;第二步也是类似操作,不过组成的三维矩阵进行维纳滤波处理,还原后的图像作为最终的结果。目前,BM3D算法是去除加性高斯白噪声最好的方法。

虽然上述降噪的方法在不同程度上取得了一定的效果,但降噪后的图像,特别是受到高密度噪声干扰的图像经过降噪后,存在图像细节(图像高频)丢失的情况。针对这一问题,本文提出了一种基于字典训练和高频增强的方法。该算法先是通过降噪算法处理后,然后由样本图像依次模拟加噪和去噪过程得到降质样本图像,样本图像和降质样本图像相减得到样本差分图像,最后分别训练样本差分图像和降质样本图像,得到的一对高、低分辨率字典,重建图像在去噪后所缺失的高频。实验表明,所提出算法的仿真结果在主观的人眼视觉和客观评价上要优于传统的图像降噪算法。

1 相关工作

设原始图像X,在受到噪声因子N后,被降质为噪声图像Y。图像降质模型表示如下:

图像降噪,就是上述图像降质的逆过程,目的是还原出与X接近的图像。

2 本文算法

BM3D算法是目前去除加性高斯白噪声最好的算法,但图像在经过BM3D算法降噪后,存在图像高频缺失的问题。针对这一问题,本文提出了一种基于字典训练和高频增强的方法。文献[9]训练了图像超分辨率后所缺失细节的字典来重建图像。受此启发,本文算法将这一思想用于重建噪声图像经过BM3D算法降噪后所缺失的图像细节。

2.1 问题模型的建立

本文算法分别重建降噪图像Yl和图像高频Yh,最终的重建图像Yfinal可以通过式(2)得到:

针对一般降噪算法中存在的图像细节较弱的问题,本文算法优化了图像高频的重建。

2.2 图像降噪

本文算法主要工作是重建降噪图像后所缺失的图像高频,因此,第一步是对噪声图像去噪。

假设未知的图像X在加噪后(即式(1)),得到的加噪图像Y作为测试图像,然后再经过BM3D算法降噪处理后获得Yl:

式中,BM3D算法用I来表示。选择BM3D算法的原因在于BM3D算法是目前去除加性高斯白噪声最好的算法,降低对样本图像重建的图像高频的依赖。测试图像如图1所示。

2.3 样本图像的预处理

对样本图像进行预处理,目的是获取能够表征去噪图像所缺失高频的字典。设样本图像为依次经过加噪和BM3D降噪后,获得的去噪样本图像则样本图像经过加噪和去噪后所缺失的高频为:

式中,称为样本差分图像,它代表的是去噪样本图像所缺失的高频。通过式(5)获得:

式中:N为噪声因子;I为BM3D降噪算法。为了拟合图像块和相应的稀疏表示,通过4个高通滤波器提取的特征。然后对依次从左到右提取图像块,分别得到HR样本图像块和LR样本图像块

2.4 字典的获取

字典训练的目的是为了获取能够表征图像高频的字典Dh,以及用于求取图像稀疏表示的字典Dl。Aharon等人提出的K-SVD算法逐行更新字典[10],相比MOD算法[11]等提升了计算速度,因此,K-SVD算法是目前在图像领域使用较多的字典训练算法。

这里通过假设高频样本图像块和去噪样本图像块具有相同的稀疏表示求解字典,即:

LR样本图像块先经过PCA降低维度,减少数据量,然后由K-SVD算法求解LR字典Dl:

式中,是去噪样本图像块的稀疏表示,同时也是的稀疏表示。之后,通过伪逆求解的方法得到字典Dh:

式中:构成矩阵K;elj构成矩阵Th。

2.5 图像高频的重建

图像高频相当于图像的细节,属于图像变化较快的信息,人眼对图像细节比较敏感,因此,图像高频(细节)的重建可以提高图像的视觉效应。字典Dh和字典Dl具有相同的稀疏表示,这里利用这一思想重建去噪图像缺失的高频。

重建图像高频的字典Dh已经获取,所以下一步应求取对应的稀疏表示。去噪图像Yl经过图像块提取Rj得到图像块:

然后利用OMP算法求解,得到字典Dl的稀疏表示系数βj:

求出稀疏表示后,在通过式(12)重建去噪图像缺失的高频:

式(12)可以看成是把重建的j个图像块按照原来块提取操作的次序还原回去。则最终的重建图像由降噪图像Yl和图像高频Yh相加获得:

2.6 算法流程

本文提出方法的流程如下:

Input:测试图像Y;样本图像

(1)样本图像由式(4)和式(5)得到样本差分图像和去噪样本图像分别经过伪逆求解和K-SVD算法得到HR字典Dh和LR字典Dl;

(2)噪声图像Y经过BM3D算法降噪后得到去噪图像Yl;

(3)图像Yl经过OMP算法获取稀疏表示系数βj,与HR字典Dh相乘后,并经过块提取的逆操作,获得去噪图像缺失的高频Yh;

(4)去噪图像Yl和重建的高频Yh相加得到最终的重建图像Yfinal;

Output:图像Yfinal。

3 实验仿真

提出的算法在Matalb软件上实现,测试图像为狮子、花朵、工人、小孩,如图2所示。

样本图像一共91幅图像,放大倍数设为3,提取的图像块大小为3×3,K-SVD算法的迭代次数设为40,4个高通滤波器分别为L=[1,0,-2,0,1]/2和LT,以及G=[1,0,-1]和GT。提出的算法与经典的BM3D算法作对比,以峰值信噪比PSNR作为客观评价指标,其数值越高越好,噪声的sigma值设为100时,对比结果如表1所示,噪声的sigma值设为200时,如表2所示。

对比图2右上角的狮子毛发,提出的算法由于采用字典重构图像去噪后缺失的高频,因而狮子毛发比BM3D较为清晰,与原图也最为接近。

d B

d B

由表1和表2可以看出,在噪声sigma值为100时,提出的算法在PSNR上比BM3D算法提高0.1~0.2 d B;在噪声sigma值为200时,提出的算法在PSNR上比BM3D算法提高1.3~2.1 d B。可以看出,在图像受到高密度噪声污染的情况下,改进的算法较BM3D算法提升较大。也就是说,在主观视觉和客观评价的指标上,改进的算法均优于经典的BM3D算法。

4 结语

训练图像 篇4

数字图像处理作为电子信息与计算机学科的一门专业课, 它是随着信号处理技术、数字成像技术计, 计算机技术和人工智能技术的发展而出现的一门交叉学科, 它以信号与系统, 数字信号处理为基础, 以遥感、医学、军事侦察等领域获取的图像为处理对象, 以计算机编程和智能处理算法为手段。因此, 数字图像处理课程是一门综合性的学科, 它包含的知识与内容非常广泛, 繁杂。它既要求学生有良好的高等数学和工程数学基础, 又要求具有一定的编程实践能力。如数学基础方面, 在图像处理算法推导过程中, 经常用到高等数学中微分、差分、偏微分、积分与多重积分和工程数学中的多元方程组、向量、矩阵以及概率等知识;而编程实践方面, 则要求学生至少能较熟练地运用VC++或Matlab编程。

鉴于数字图像处理课程的上述特点, 对于初次接触图像处理的学生来说, 感觉该课程的学习非常困难, 甚至有时觉得无从下手。经常出现这样的情况, 教师在课堂上讲述相关的基础知识、基本理论和详细的算法步骤后, 同学们似乎听懂和掌握了, 但布置的课后习题和编程实验却只有很少一部分同学能较好地完成。经过多年的教学观察和分析, 发现能较好地完成作业特别是编程实验的小部分同学一般对编程有较浓厚的兴趣, 平时喜欢编一些小程序, 动手能力较强。为此, 总结多年的教学经验, 我们提出一种基于工程训练的专题化教学方法。教学实践表明该方法既能提高学生的动手能力, 更好地将课堂上学到知识运用到解决具体问题的实践中去, 又能使学生有一定的成就感, 从而激发学生的学习兴趣, 反过来, 学生在课堂上能更认真听讲。使课堂教学和课后实践相辅相成, 相互促进, 取得了良好的教学效果。

2 基于工程训练的教学方法

2.1 教学内容的专题化

数字图像处理作为综合性实践性很强的交叉学科, 其涉及的教学内容非常广泛、繁杂, 而作为一门计算机相关专业的专业选修课程, 其课堂教学的学时有限, 不可能面面俱到。因此, 如何在有限的教学时间内图像处理的重点内容和学习实践方法由点到面、由浅入深地传授给学生是课程教学的难点, 为此, 我们将图像处理的教学内容根据应用目的的分成了以下几个专题来开展教学: (1) 图像处理基础知识; (2) 图像空域增强处理; (3) 图像频域增强处理; (4) 图像变换; (5) 图像分割; (6) 图像编码与压缩; (7) 彩色图像处理。其中图像处理基础知识部分由主讲教师重点讲授有关数字图像处理技术的基本概念和基础理论, 引领学生总体上把握图像处理课程的知识结构和处理方法。后续6个专题则采用教师精讲和学生调研、实验、演示相结合的方式展开教学, 充分发挥学生的主动性, 使学生从传统教学中被动接受教师灌输的知识转变为主动探索未知的世界, 大大激发了学生的学习兴趣。

2.2 教学内容的组织实施

教学专题确定后, 为更好地提高教学效果和促进学生之间的互帮互学, 我们将学生分成4~5个人的学习小组, 每组指定一个组长负责组内成员的学习、实验任务的分工协作。组长对教师负责, 教师主要对组长进行详细的任务布置和学习指导并听取其学习总结和进展汇报。每个专题的教学活动分为四个阶段。

(1) 教师精讲阶段, 主讲教师主要讲解该专题的基本知识与处理方法, 对专题涉及的难点内容作较为详细的介绍。而一般的内容则布置学生课后自学, 同时, 老师给出相关问题和学习目标。

(2) 调研综述阶段, 首先学生通过研读教材、复习笔记巩固相关专题的基础知识与基本理论, 然后查阅图书馆中的相关期刊论文、图像处理网站资料来扩充相关专题知识。为了节省时间、提高效率, 小组组长可以让每位成员深入调研一种图像处理算法, 写出文献综述报告, 然后在小组内展开讨论, 最终由组长总结制作小组专题调研报告。

(3) 图像算法实验阶段, 小组根据综述报告内容, 详细设计实验方案和完善实验步骤、编写算法程序验证实验结果。需要注意的是:由于专题内容的基本相同, 实验阶段不同小组成员之间尽量少交流, 以便各小组能独立完成实验。

(4) 学生讲解演示阶段, 小组成员分工协作完成综述报告、实验方案及算法验证后, 将实验内容、实验结果与小组分析讨论的结论制作成7~8分钟左右的PPT文档。由小组推选一位同学作专题汇报, 为使每位同学都有锻炼机会, 小组成员可以轮流作专题汇报, 这样, 一个学期内, 每个同学都有1~2锻炼机会, 同时这样也能避免有些同学搭便车的偷懒行为, 激发每位同学的学习主动性。每组同学汇报要接受老师和同学的质疑和评价, 为做到公平起见, 每组可以推选一位同学作为评价代表与老师一起组成评价小组, 老师的评价成绩占30%, 小组学生成员的平均评价成绩占70%。各小组根据同学和教师提出的意见修改综述报告、实验方案及专题报告。

2.3 教学效果评价与分析

现行的教学评价主要由教师评价学生的学习效果, 评价方式为:笔试+平时考核+实验。这种评价模式使得学生缺乏实践学习的主动性, 影响学生探索创新能力的培养。专题化教学则可以采用多向性、多角度方法评价教学效果和学生的表现。对学生的评价方式和传统形式相同, 但实质内容已悄然发生了变化。其中笔试开卷, 主要考核学生数字图像处理基础理论的掌握程度, 培养学生分析问题解决问题的能力;平时考核以搜集资料、课堂发言和作业为考核内容, 引导学生从平时学习做起, 激发学生上课的热情和避免考前突击现象的发生;实验考核学生算法实现和实验设计的能力。这种评价方式不仅提高了评价的灵活程度, 也有利于培养学生的学习能力, 深受学生的欢迎和好评。

3 结语

基于工程训练的图像处理课程专题化教学大大激发了学生的学习兴趣, 积极调动他们的学习主动性, 在文献调研、总结讨论和实验中, 培养了学生的团结协作精神和探索创新能力。数字图像处理作为当今极具发展前景的学科, 我们还将继续探索实践, 不断完善教学内容和方法, 以适应社会对该领域人才的需求。

参考文献

[1]贾永红.“数字图像处理”课程的建设与教学改革[J].高等理科教育, 2007 (1) :96~98, 111.

训练图像 篇5

人脸识别作为一种最常用的生物特征识别技术,具有非接触性、唯一性和不可复制性等特点,相对于其他生物特征识别技术,人脸识别具有明显的优势,在视频检索、身份识别、安全防范等领域具有广泛的应用前景,成为计算机图像和视频研究领域中的热点问题[1]。

对于人脸识别问题,学者们进行了大量研究,取得了不错的进展,涌现出了许多人脸识别算法,但仍然有许多问题有待解决,比如,如何从人脸图像提取和选择描述人脸图像类别的关键特征,如何设计识别性能优异的人脸分类器[2]。当前人脸特征提取方法主要有: 空间投影特征、结构特征和变换域特征等[3]。 子空间特征由于采用空间压缩技术,降低了特征维数,但同时也丢失了许多重要的特征,而且识别结果没有可解释性[4]; 结构特征的计算复杂度高,人脸识别效率低,而且识别结果极不稳定,鲁棒性差; 变换域特征主要通过采用小波变换、傅里叶变换等提取特征,但它们不能提取人脸图像的纹理信息,稳定性比较差[5]。这些特征提取方法均是基于外观的人脸识别方法,需要每类人脸包含大量人脸图像,导致人脸识别系统的成本高,结构复杂,不利用推广。同时,在犯罪取证、护照验证等特殊场合,每类人脸只能得到一幅人脸图像,是一种典型的单样本人脸识别问题,因此单样本的人脸识别问题更具有实用价值。在单样本特征提取程,希望尽可能多地从一幅人脸图像提取更多的特征信息。文献[9]采用主成分分析和积分投影相结合的人脸特征提方法,获得较高准确率的人脸识别结果; 文献[10]通过虚拟人脸技术,获得较多数量的人脸样本,提高了单样本人脸识别效果,但增加了计算机开销; 文献[11]提出基于分块的单样本人脸识别算法,首先将图像划分为多个小块,然后采用线性识别分析算法提取人脸特征,实验结果证明了其有效性; 文献[12]提出基于学习框架的单样本人脸识别算法,将单样本问题变成了多样本问题,但是在实际应用中很难找到通用性强的数据集。

针对传统单样本人脸识别算法存在的不足,为提高单样本人脸识别准确性,本文提出一种基于图像分块和特征选择的单样本人脸识别算法。首先将人脸图像划分成子块,并分别提取各子块的特征,连接成人脸图像特征向量,然后采用多流形判断分析算法选择对人脸识别结果贡献较大的特征。最后计算采用支持向量机对人脸进行识别,并采用Yale B和PIE人脸库进行仿真测试,检验本文单样本人脸识别算法的可行性和优越性。

1 人脸识别算法的框架

本文提出的人脸识别算法框架如图1所示。基本思想为: 首先收集人脸图像,并采用轮廓波变换对人脸图像进行预处理, 然后将人脸图像划分多个子块,并提取其特征,组成人脸特征向量,最后采用多流形判断分析算法选择最优人脸特征子集,并采用支持向量机对人脸样本进行学习,建立人脸分类器。

2 人脸识别算法的设计

2. 1 人脸图像预处理

人脸图像在采集过程,由于受到光照变化、环境、照相机等多种因素的影响,会产生许多噪声,若将其直接用于特征提取, 噪声会对人脸特征提取结果产生负面影响,影响人脸识别的最终结果,因此在提取人脸图像之间,需要对其进行预处理。由于Contourlet变换具有较好去噪效果,为此首先对人脸图像进行Contourlet变换,消除其中的噪声信息,然后对人脸图像重构,获得更优的人脸图像。Contourlet变换包括拉普拉斯塔式分解和方向滤波器组两部分,其工作原理如图2所示。一幅人脸图像经过Contourlet变换去噪后,结果如图3所示,其中( a) 为原始图像,( b) 为处理后的效果图。从图3可知,相对于原始图像,图像效果得到了增强。

2. 2 人脸图像分块

对于单幅人脸识别图像,首先将人脸图像划分成多个均匀或不均匀的子块,对于具体人脸图像,子块的大小不同。假设人脸图像的大小为H × W像素,先将每幅人脸图像平均划分为互不重叠的C个子图像,具体如图4所示。

2. 3 人脸图像特征提取和选择

设一幅人脸图像第i个流形中第r块为xir,Nintra和Ninter分别表示其流形内部和外部近邻,多流形判提取人脸图像可以转化成最优化问题,即:

其中,Airp、Birq为亲和矩阵; x'irp代表第p个流形外部k1近邻,xirq表示第q个流形内部k2近邻。

亲和矩阵A、B计算公式为:

其中,k1、k2及 σ 是3个先验固定参数; Nikn1ter( xir) 、Nikn2tra( xir) 分别表示xir的流形外部k1近邻及流形内部k2近邻。

那么可得:

其中,F1与F2为两个常数矩阵。

J1( Wi) 和J2( Wi) 可以简化为:

其中,

这样人脸特征的投影矩阵Wi可以通过下式得到:

设 { w1,w2,…,wdi} 为包含di个特征值{ λjj = 1,2,…,di} 所对应的特征向量,W = { w1,w2,…,wdi} 是Wi的投影矩阵,就可以N个投影矩阵W1,W2,…,WN。

2. 4 支持向量机的人脸分类器

支持向量机分类目标是指在一定条件的约束下,找到一个最优分类平面,不仅将全部样本点分成为两类,而且它们之间的距离尽可能最大。设人脸图像数据集 { xi,yi} ,xi∈ Rn,i = 1,2, …,n,xi表示选择的人脸行征向量机; yi表示人脸类别,那么支持向量机的分类平面可以描述为[8]:

其中,ω 和b参数。

对于一非线性问题,无法对式( 1) 进行求解,通过引入松弛因子变为:

s. t.yi( w·Φ( xi) + b) ≥ 1 - ξiξ ≥ 0,i = 1,2,…,n其中,C为惩罚参数。

引入Lagrange乘子将式( 2) 变为其对偶问题,则可以得到:

其中,αi表示Lagrange乘子。

采用式( 10) 计算权向量 ω 的值:

那么,人脸图像的二分类函数变为:

其中,Φ( xi) ·Φ( xj) 表示点积。

最后,引入核函数[6],加快问题的求解速度,可以得到:

采用RBF函数核函数[6],支持向量机的二分类函数为:

3 仿真实验

3. 1 数据来源

Yale B人脸包含38个人、64种不同光照条件下的图像,每个人在不同光照条件下有5个子集,子集1包含7幅图像,子集2、3、4和5分别包含12、12、14、19幅图像,子集数目越大,光照变化就越明显。Yale B人脸图像示例如5所示。

PIE人脸库包含65类人脸图像,每类有21张图像,人脸图像示例如6所示。

3. 2 结果与分析

3. 2. 1 本文算法的识别结果

对于Yale B和PIE人脸库,选择第一幅图像作为训练样本,建立人脸识别模型,然后将剩下图像作为测试集,它们的识别结果如图7所示。从图7可以知道,随着人脸特征增加,人脸识别率不断增加,Yale B和PIE人脸库的最高人脸识别率分别为75. 12% 和84. 47% ,较好地满足了人脸识别精度要求。实验结果表明,本文人脸识别建立模型思想是正确、有效的。

3. 2. 2 与其他单本本人脸识别算法的性能比较

为了测试本文算法的优越性,使其结果更具说服力,选择文献[12,13]的单样本人脸识别算法进行对比实验,结果如图8和图9所示。从图8可知,在Yale B和PIE人脸库上,相对于其他算法,本文算法的人脸识别率更高,具有一定的优越性。从图9可知,相对于其他算法,本文的平均人脸识别时间明显减少, 人脸识别速度得以提高,可以用于人脸识别的实时性要求。

4 结 语

上一篇:机械粉碎下一篇:运输要点