智能图像识别(共10篇)
智能图像识别 篇1
摘要:图像识别技术是信息时代的一门重要的技术,其产生目的是为了让计算机代替人类去处理大量的物理信息。随着计算机技术的发展,人类对图像识别技术的认识越来越深刻。图像识别技术的过程分为信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。文章简单分析了图像识别技术的引入、其技术原理以及模式识别等,之后介绍了神经网络的图像识别技术和非线性降维的图像识别技术及图像识别技术的应用。从中可以总结出图像处理技术的应用广泛,人类的生活将无法离开图像识别技术,研究图像识别技术具有重大意义。
关键词:图像识别,原理,过程,分析,神经网络,非线性
1 图像识别技术的引入
图像识别是人工智能的一个重要领域。图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。图像识别,顾名思义,就是对图像做出各种处理、分析,最终识别我们所要研究的目标。今天所指的图像识别并不仅仅是用人类的肉眼,而是借助计算机技术进行识别。虽然人类的识别能力很强大,但是对于高速发展的社会,人类自身识别能力已经满足不了我们的需求,于是就产生了基于计算机的图像识别技术。这就像人类研究生物细胞,完全靠肉眼观察细胞是不现实的,这样自然就产生了显微镜等用于精确观测的仪器。通常一个领域有固有技术无法解决的需求时,就会产生相应的新技术。图像识别技术也是如此,此技术的产生就是为了让计算机代替人类去处理大量的物理信息,解决人类无法识别或者识别率特别低的信息。
1.1 图像识别技术原理
其实,图像识别技术背后的原理并不是很难,只是其要处理的信息比较繁琐。计算机的任何处理技术都不是凭空产生的,它都是学者们从生活实践中得到启发而利用程序将其模拟实现的。计算机的图像识别技术和人类的图像识别在原理上并没有本质的区别,只是机器缺少人类在感觉与视觉差上的影响罢了。人类的图像识别也不单单是凭借整个图像存储在脑海中的记忆来识别的,我们识别图像都是依靠图像所具有的本身特征而先将这些图像分了类,然后通过各个类别所具有的特征将图像识别出来的,只是很多时候我们没有意识到这一点。当看到一张图片时,我们的大脑会迅速感应到是否见过此图片或与其相似的图片。其实在“看到”与“感应到”的中间经历了一个迅速识别过程,这个识别的过程和搜索有些类似。在这个过程中,我们的大脑会根据存储记忆中已经分好的类别进行识别,查看是否有与该图像具有相同或类似特征的存储记忆,从而识别出是否见过该图像。机器的图像识别技术也是如此,通过分类并提取重要特征而排除多余的信息来识别图像。机器所提取出的这些特征有时会非常明显,有时又是很普通,这在很大的程度上影响了机器识别的速率。总之,在计算机的视觉识别中,图像的内容通常是用图像特征进行描述。
1.2 模式识别
模式识别是人工智能和信息科学的重要组成部分。模式识别是指对表示事物或现象的不同形式的信息做分析和处理从而得到一个对事物或现象做出描述、辨认和分类等的过程。
计算机的图像识别技术就是模拟人类的图像识别过程。在图像识别的过程中进行模式识别是必不可少的。模式识别原本是人类的一项基本智能。但随着计算机的发展和人工智能的兴起,人类本身的模式识别已经满足不了生活的需要,于是人类就希望用计算机来代替或扩展人类的部分脑力劳动。这样计算机的模式识别就产生了。简单地说,模式识别就是对数据进行分类,它是一门与数学紧密结合的科学,其中所用的思想大部分是概率与统计。模式识别主要分为三种:统计模式识别、句法模式识别、模糊模式识别。
2 图像识别技术的过程
既然计算机的图像识别技术与人类的图像识别原理相同,那它们的过程也是大同小异的。图像识别技术的过程分以下几步:信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。
信息的获取是指通过传感器,将光或声音等信息转化为电信息。也就是获取研究对象的基本信息并通过某种方法将其转变为机器能够认识的信息。
预处理主要是指图像处理中的去噪、平滑、变换等的操作,从而加强图像的重要特征。
特征抽取和选择是指在模式识别中,需要进行特征的抽取和选择。简单的理解就是我们所研究的图像是各式各样的,如果要利用某种方法将它们区分开,就要通过这些图像所具有的本身特征来识别,而获取这些特征的过程就是特征抽取。在特征抽取中所得到的特征也许对此次识别并不都是有用的,这个时候就要提取有用的特征,这就是特征的选择。特征抽取和选择在图像识别过程中是非常关键的技术之一,所以对这一步的理解是图像识别的重点。
分类器设计是指通过训练而得到一种识别规则,通过此识别规则可以得到一种特征分类,使图像识别技术能够得到高识别率。分类决策是指在特征空间中对被识别对象进行分类,从而更好地识别所研究的对象具体属于哪一类。
3 图像识别技术的分析
随着计算机技术的迅速发展和科技的不断进步,图像识别技术已经在众多领域中得到了应用。2015年2月15日新浪科技发布一条新闻:“微软最近公布了一篇关于图像识别的研究论文,在一项图像识别的基准测试中,电脑系统识别能力已经超越了人类。人类在归类数据库Image Net中的图像识别错误率为5.1%,而微软研究小组的这个深度学习系统可以达到4.94%的错误率。”从这则新闻中我们可以看出图像识别技术在图像识别方面已经有要超越人类的图像识别能力的趋势。这也说明未来图像识别技术有更大的研究意义与潜力。而且,计算机在很多方面确实具有人类所无法超越的优势,也正是因为这样,图像识别技术才能为人类社会带来更多的应用。
3.1 神经网络的图像识别技术
神经网络图像识别技术是一种比较新型的图像识别技术,是在传统的图像识别方法和基础上融合神经网络算法的一种图像识别方法。这里的神经网络是指人工神经网络,也就是说这种神经网络并不是动物本身所具有的真正的神经网络,而是人类模仿动物神经网络后人工生成的。在神经网络图像识别技术中,遗传算法与BP网络相融合的神经网络图像识别模型是非常经典的,在很多领域都有它的应用。在图像识别系统中利用神经网络系统,一般会先提取图像的特征,再利用图像所具有的特征映射到神经网络进行图像识别分类。以汽车拍照自动识别技术为例,当汽车通过的时候,汽车自身具有的检测设备会有所感应。此时检测设备就会启用图像采集装置来获取汽车正反面的图像。获取了图像后必须将图像上传到计算机进行保存以便识别。最后车牌定位模块就会提取车牌信息,对车牌上的字符进行识别并显示最终的结果。在对车牌上的字符进行识别的过程中就用到了基于模板匹配算法和基于人工神经网络算法。
3.2 非线性降维的图像识别技术
计算机的图像识别技术是一个异常高维的识别技术。不管图像本身的分辨率如何,其产生的数据经常是多维性的,这给计算机的识别带来了非常大的困难。想让计算机具有高效地识别能力,最直接有效的方法就是降维。降维分为线性降维和非线性降维。例如主成分分析(PCA)和线性奇异分析(LDA)等就是常见的线性降维方法,它们的特点是简单、易于理解。但是通过线性降维处理的是整体的数据集合,所求的是整个数据集合的最优低维投影。经过验证,这种线性的降维策略计算复杂度高而且占用相对较多的时间和空间,因此就产生了基于非线性降维的图像识别技术,它是一种极其有效的非线性特征提取方法。此技术可以发现图像的非线性结构而且可以在不破坏其本征结构的基础上对其进行降维,使计算机的图像识别在尽量低的维度上进行,这样就提高了识别速率。例如人脸图像识别系统所需的维数通常很高,其复杂度之高对计算机来说无疑是巨大的“灾难”。由于在高维度空间中人脸图像的不均匀分布,使得人类可以通过非线性降维技术来得到分布紧凑的人脸图像,从而提高人脸识别技术的高效性。
3.3 图像识别技术的应用及前景
计算机的图像识别技术在公共安全、生物、工业、农业、交通、医疗等很多领域都有应用。例如交通方面的车牌识别系统;公共安全方面的人脸识别技术、指纹识别技术;农业方面的种子识别技术、食品品质检测技术;医学方面的心电图识别技术等。随着计算机技术的不断发展,图像识别技术也在不断地优化,其算法也在不断地改进。图像是人类获取和交换信息的主要来源,因此与图像相关的图像识别技术必定也是未来的研究重点。以后计算机的图像识别技术很有可能在更多的领域崭露头角,它的应用前景也是不可限量的,人类的生活也将更加离不开图像识别技术。
4 总结
图像识别技术虽然是刚兴起的技术,但其应用已是相当广泛。并且,图像识别技术也在不断地成长,随着科技的不断进步,人类对图像识别技术的认识也会更加深刻。未来图像识别技术将会更加强大,更加智能地出现在我们的生活中,为人类社会的更多领域带来重大的应用。在21世纪这个信息化的时代,我们无法想象离开了图像识别技术以后我们的生活会变成什么样。图像识别技术是人类现在以及未来生活必不可少的一项技术。
参考文献
[1]http://tech.sina.com.cn/it/2015-02-15/doc-iavxeafs1157951.shtml
[2]陈华.浅谈神经网络的图像识别技术及方法[J].济宁师范专科学校学报,2006,27(6):20-22.
[3]万国红.基于神经网络的图像识别与分类技术及应用研究[D].华中科技大学,2002.
[4]谭璐,易东云,吴翊,等.基于非线性降维方法的图像识别[C].中国计算机学会全国web信息系统及其应用学术会议.2004.
[5]刘翠响,张艳,于明,等.基于非线性降维的人脸图像数据分析[C]//2006中国控制与决策学术年会.2006.
[6]孙杰,张以谟,刘铁根.Web图像识别技术及实现[J].计算机工程与设计,2006,27(4):587-589.
智能图像识别 篇2
关键词:计算机智能化;图像识别技术;理论性探究
中图分类号:TP391
计算机智能化图像识别主要是利用计算机系统对输入的图像进行处理和分析从而识别出多种不同模式的对象。计算机技术和信息技术的不断发展使得计算机智能化图像识别技术得到了越来越广泛的应用。信息时代的今天,人们在生产实践的活动过程中已经不再凭借身体的各个器官来接受信息和感知世界的,计算机智能化图像识别技术可以快速地获得所需要的信息从而帮助人们更好地思考和决策[1]。虽然计算机智能化图像识别技术在我国已经获得了相当程度的发展,但是要想赶上时代的步伐应对变化莫测的国际市场就必须对计算机智能化图像识别技术进行理论上的突破。本文在此将重点讨论计算机智能化图像识别技术的相关发展和创新。
1 计算机智能化图像识别系统概述
计算机智能化图像识别系统一般分为五个部分,即对所要识别的图像通过一定的方式将其输入到计算机内,经过计算机预处理和特征提出再对识别的图像进行匹配和分类。作为计算机智能化图像识别的第一步,图像输入主要是将已经采集到的图像输入到计算机内进行处理。计算机预处理过程主要是对将要识别的图像进行图像区和背景区的分离并且将图像进行细化增强图像的二值化,提高计算机智能化图像识别的后期处理的速度和效率。为了能够尽量地还原图像的真实性和减少其虚假特征可以将图像的特有特征用数值的形式表示出来。在计算机智能化图像识别系统中如果需要将输入的图像与已有的图像进行匹配就必须用一种精确的方法将其分配到不同的图像库中减少计算机对图像的搜索时间。在计算机智能化图像识别系统中为了准确地判断出所输入的图像的性质就必须把当前输入的测试图像和之前已经保存的图像进行对比和分析。具体如下图所示:
图1 计算机智能化图像识别系统
一般来说,计算机智能化的图像识别技术常用的方法包括统计识别法、句法识别法与神经网络识别法等三种方法。
(1)统计识别法。由于在实际图像中背景与目标的线性是不可分割的,所以统计识别法是具有最小分类误差的一种方法。其原理主要以数学中有关决策理论的知识为基础,建立统计学的识别模型,并通过此类模型对图像作出分析与统计,寻找图像中认识的规律性,最终利用图像特点中本质特征的提出来实现识别。
(2)句法识别法。此类方法是统计识别法的一种补充,其对图像特性的描述主要依靠的是符号。由于句法识别法学习了语言学内句法层次的结构排列,所以它能够通过分层表述的方式将复杂的图像简化为简单的多层子图像或单层图像,能够有效突出被识别图像结构的信息。
(3)神经网络识别法。所谓神经网络识别法,主要是指利用神经网络中计算的方法对目标图像作出识别的一种方式。由于神经网络存在着能够实现分布式处理与存储、能够大规模实现并行、具有自适应与自组织能力,所以此类方式在处理需要同时对模糊与不精确的许多条件与因素作出考虑的图像进行处理时尤为有效。
2 计算机智能化图像识别技术的研究现状
在对图像进行识别和处理的领域中图像的识别和分割是一个也重要的问题。虽然在相关专家和工作人员的共同努力下取得了相关的发展,但是还是有许多的问题需要解决。传统的图像识别主要经历了文字识别和数字处理以及物体识别三个阶段。在20是50年代的时候文字识别的对象主要是字母和数字以及符号,许多的专用设备都开始广泛地运用了这一技术。在20世纪60年代中期数字图像开始运用于对图像的处理和识别的研究领域,数字化图像处理更加具有存储量大和方便传输和压缩等优势,为图像识别技术的发展提供了非常广泛的发展空间。数字图像处理主要是表现在对物体的识别中的三维数据和图片的感知和认识。物体识别主要是在前两个阶段的基础上借助了人工智能化的特点将其研究和探索的成果广泛地运用到各种行业领域中。
计算机智能化图像识别技术在目前需要提高其对图像的识别能力,在图像的传输过程中充分地运用不同类别空间的映射[2]。作为一种成熟的图像识别和处理技术,计算机智能化图像处理技术在不断地研究和发展,对各种图像的类别和特征进行有效地对比和匹配,提高图像处理后的清晰度和识别度。
3 计算机智能化图像识别技术的特点和优点
3.1 计算机智能化图像识别技术的主要特点
(1)信息量大。计算机对图像信息的处理主要是采用二维信息的方式,因此对计算机的配置和计算机的运行系统的速度以及计算机的存储量都有非常严格的要求。图像信息与语言信息相比所需要的频带较宽,无论是在计算机的成像过程中还是在图像的传输中以及图像信息的存储和处理的过程中都需要一定的科学技术。
(2)相关性大。计算机系统中对图像的各个像素都是具有一定的关联性,所以在计算机智能化图像的识别过程中需要对输入的各种图像信息进行有效地压缩才能够对不同的图像信息进行分类和匹配。尤其是对三维景物的选取上,输入的图像本身是没有再现三维景物的几何信息能力,因此对三维景物的背后所需要反映的部分信息必须进行适当地假设和重新的测量[3]。计算机在对图像进行智能识别的过程中需要对三维景物进行适当地引导以便于解决在计算机智能化图像识别过程中所产生的问题。
(3)人为因素大。计算机智能化图像识别在对图像进行后期处理之后总是由人来进行评价的,因而计算机在对图像进行智能化识别的时候受人的因素影响较大。然而,人的眼睛总是会受到周围环境的影响以及情绪和知识兴趣爱好的影响。因此,为了提高计算机对图像进行智能化识别的质量应该尽量地让计算机模仿人的视觉,充分地模拟人们在对图像进行观察和评价时候的状态。
3.2 计算机智能化图像识别技术的优点
(1)精确度高。因为现在的科学技术水平的限制只能将一幅模拟的图像进行数字化处理转换为一种二维数组,基本的扫描仪都能够对图像的像素转化为32位。因此计算机智能化图像识别能够将任何的图像的精确度满足用户的任一要求。
(2)表现型强。计算机智能化图像处理可以准确地处理影响图像处理的相关因素,例如图像的存储状况和图像的输入过程中出现的问题和故障。计算机智能化图像识别系统能够在任何的情况下对图像进行还原和再现从而保证了图像在经过计算机识别和处理的时候的像素。
(3)灵活性好。计算机智能化图像识别系统在对图像进行识别和处理的时候,可以根据图像的客观情况来将其放大。由于图像的信息总是来自于各个方面,无论是来自生物显微镜下的细胞图像还是对于宇宙中位于天文望远镜下的庞然大物都能够在计算机智能化图像识别系统中进行识别和处理,通过线性运算和非线性处理实现图像的识别功能[4]。在对各种不同的图像信息进行正确地编码之后用二维数据将图像的灰度进行组合在计算机上可以清晰地显示出图像的质量。
4 计算机智能化图像识别技术的理论性突破
4.1 计算机智能化图像识别技术朝着高速化和标准化的方向发展
无论是在生活领域还是科学领域计算机的运行速度都会对生活和工作产生重要的影响。尤其是对图像进行智能识别对计算机具有特别的要求,而现在的计算机在科学技术水平的促进下不断地提高其自身的硬件水平。不仅如此,在计算机的内部配置方面也比以前有了相当大的进步,计算机在进行图像的采集和处理的过程中分辨率都大大地提高了,同时对图像的存储设备的性质也在日益地更新。图像作为一种二维度信息,计算机将其进行识别的过程中将更多的三维信息赋予图像中并且通过各种计算和技术的处理而得到相应地改进[5]。
同时,计算机在对图像所显示的数据进行整理和压缩的时候开始以多媒体的形式对其进行信息化转换,使得计算机智能化图像识别尽量能够按照人的思维和意识来进行从而提高计算机的智能化水平和对图像识别的工作效率。
4.2 计算机智能化图像识别技术朝着多维方向和高科技方向发展
计算机在对图像进行识别的过程中开始从二维角度向三维角度和多维角度发展,因此对各种图像的数据信息处理的更加精确。目前由于硬件水平的逐渐提高,计算机的中央处理器的功能也在不断地提高,因此计算机智能化图像识别的领域越来越广泛。随着新的技术理论和新的科学计算方法的诞生,计算机在对图像的识别和处理过程中更加侧重对其详细的信息进行分类和整理,经过系统的转化后形成高清晰度的图片。
5 计算机智能化图像识别技术的运用
计算机智能化的图像识别技术尽管面临着许多困难与问题,但此类技术依旧得到了较好与较快的发展。就近些年其变化与发展而言,在今后的发展过程中,计算机智能化的图像识别技术将会出现飞速的发展阶段,人工智能与立体视觉同时也将成为计算机智能化的图像识别技术未来发展的方向。由于短时间内图像识别技术实现计算机通用性较大的全自动系统的可能性较小,所以在未来的发展历程中,计算机智能化的图像识别系统需要和不同类型的应用进行结合开发。
5.1 医学生物工程
计算机智能化图像识别技术可以对诸如红细胞和各种染色体进行识别,从而有利于医生更好地了解患者的病情和更好的医学研究。在医院的很多部门例如心电图的分析以及彩超和超声波图像处理都广泛地运用了计算机智能化图像识别技术。
5.2 工程建设方面
计算机智能化图像识别技术在工程项目的建设过程中得到了广泛的应用,尤其是对相关零部件的检测和分类以及对输电线路故障的分析和排查方面都借助计算机的智能化工程得到了有效地解决。在工业生产过程中,施工人员对工程的焊接和装配的过程中都充分地运用计算机对图像进行智能化识别从而减少了施工误差的发生,保障了整个工程项目建设的质量。
5.3 文学艺术方面
文学艺术方面对计算机智能化图像识别技术的使用非常普遍。在广播电视领域,电视要想播出高清晰度、高质量的画面就必须借助计算机对所拍摄的画面进行处理和识别。计算机能够对动态图像进行相应地采集加工合成从而形成电视画面。为了避免图像在播出的时候出现失贞的情况,计算机可以对输入的画面进行智能化处理,尤其是一些人为的失误都能够通过计算机进行自动地调整。在美术方面,计算机智能化图像识别技术可以对每一幅作品的像素和色彩方面进行相关地调整,使其输出后能够更好地反映现实生活的。除此之外,计算机智能化图像识别技术在服装设计与制作和动画制作以及发型设计等方面均发挥了重要的作用。
5.4 商务业务方面
计算机智能化图像识别技术在电子商务和酒店商务方面具有重要的影响,其可以在很多的方面代替人工操作从而节省大量的人力资源。比如,员工每天在进行上下班的时候都可以在经过大门通道的时候进行电子身份签到和认证。同时对于一些重要的商业资料也可以通过计算机智能化图像识别技术进行防伪说明等等。
除此之外,计算机智能化图像识别技术还经常运用于航空航天事业和通信工程事业以及科学研究等领域方面,为我国的经济发展带来了重大的影响。
6 结束语
文中通过对计算机智能化图像识别技术的特点和概念以及其优点等方面进行了简要地分析和阐述,同时对其在理论上的创新和突破进行了讨论。计算机智能化图像识别技术在科学技术的发展下还有很长的路要走,我们必须对其进行高度地重视。随着社会的发展,对图像进行智能化地处理越来越重要。计算机智能化图像识别技术在工业和农业以及科学研究等各个方面将发挥关键的作用。同时,计算机智能化图像识别技术在不断地运用和发展过程中将会越来越成熟。
参考文献:
[1]杨小冬,宁新宝.自动图像识别系统图像分割算法的研究[J].南京大学学报,2009,40(4):424-431.
[2]李建华,马小妹.基于方向图的动态阈值指纹图像二值化方法[J].大连理工大学学报,2008,42(5):626-628.
[3]康剑莉,陈罡,毛金明.基于Cabor小波特征的磨粒图像识别新方法[J].激光与红外,2010,3,35(3).
[4]柳稼航,杨建峰,单新建,尹京苑.一种基于优先搜索方向的边界跟踪算法[J].遥感术与应用,2011,19(3):209-213.
[5]成金勇,范延滨,宋洁.基于小波分析与Snake 模型的图像边缘检测方法[J].青岛大学学报:自然科学版,2012,3:78-81.
作者简介:唐录洁(1977.5-),女,贵州凯里人,本科,讲师,主要研究方向:计算机应用与技术。
智能图像识别 篇3
图像识别是人工智能的重要部分, 将识别图像的关键特征点作为比较对象, 通过使用计算机技术对图像识别信息的选取、比较、鉴别、判断, 最终识别出图像的类型及相关数据, 并获得某种我们预期得到的结论。
对图像进行智能识别时, 经常会用到图像智能识别以及增强技术, 通过抽取所需要的图像并综合运用各种方法提高图像质量, 从而增强识别的准确性。在数据记录设备长时间的数据记录后, 如何从中选取出有用的信息, 同时因图像获取端远离接收端, 需要将获得的图像传输到处理设备一侧, 并在这些传输之中进行各种符合格式要求的转换, 在多次传输类型的转换和长距离传输后, 通常会引起图像质量的降低。以上的降低是在假设输入端信号良好的情况下所获得的结论, 但是综合考虑高速运动物体拍摄时的客观条件影响 (如亮度因素、镜头因素、相对运动、高速跟踪等) , 都会使图像的质量下降, 同时在传输过程中, 尤其是模拟信号传输阶段, 必然会引入各种噪声并产生信号的衰减。因此未经处理的图像在信号可识别度及处理速度等方面都具有改进空间, 通过采取一定的技术手段提高数据的识别效能, 提高识别效率, 具有很强的现实性。为解决这一问题, 根据实际需求通过图像智能识别并进行增强处理, 将获得图像中的关键信息凸显出来, 与此同时可以将不需要信息的影响降至最低。
获得的图像通过合理和适合的增强处理后, 可以将原本不清晰甚至是不利于分辨的图像增强至清晰的, 同时包含大量可用信息的图像, 高效率地去除获得图像中的噪点、增强图像的可辨别度和辨别的准确度, 从而更方便对图像中所需要一种简便可行的图像识别处理过程可以增强、分类和匹配等。
1 图像的输入
想要对图像进行处理, 首要工作就是获得所需要的素材, 即使用计算机技术将图像采集下来。针对高速经纬仪拍摄的画面特点和类型, 选取适合的传输手段, 在满足传输速率的情况下尽可能的提高传输质量, 使用数字信号进行传输, 减少损耗, 减少模数、数模转换, 提高效率。
2 获取图像的预处理
对获取的图像进行计算, 是一项运算量很大的工作, 因为我们所需要的信息只是其中的一部分, 因此降低后续算法的复杂度并提高效率是我们不得不关心的一个内容, 因此对图像进行预处理就显得尤为重要了, 这是一项基础性的工作, 如果没有进行预处理, 那么后续的图像识别工作将很难开展下去, 预处理的结果将直接影响最终图像识别的效果和速度。
预处理所要达到的目的是将图像中的噪声尽量消除或减小, 对所需要的部分进行背景分离, 将有效信息区域从大量的信息中抽取出来, 最终提高图像关键点提取能力并增强匹配精度, 便于最终提取出正确的图像特征。一般情况下采取以下方法进行图像信息的预处理。
2.1 方向图计算
方向图广泛应用于图像增强、特征提取、自动分类、方向模版匹配等图像识别的重点处理环节。常规提取方向图的方法分为以下三步:一是进行图像分割, 将图像分割成足够小的子块;二是对获得的每一个子块进行数据分析, 对其中的每一个点进行独立的计算, 可以利用算子分别计算每一个子块中每一个点的x以及y方向梯度;三是根据梯度值, 对每个子块方向进行计算, 从而最终得到图像的方向。
2.2 图像分割
从一般角度讲, 图像分割主要有3大类方法: (1) 基于边缘; (2) 基于区域; (3) 基于纹理。根据高速运动目标的特性, 图像样本算法选择的时候就只能采用基于边缘的这一类算法。
每一幅待处理的图像, 根据所包含的信息可以分为四个区域: (1) 背景区; (2) 不可恢复区; (3) 清晰区; (4) 可恢复区。通过图像分割, 可以将背景区和不可恢复区剔除出去, 剩余的信息就是有用的清晰区和可恢复区了。这一方法可通过三步实现: (1) 首先分割出背景区域; (2) 再从前景中分割出模糊区域; (3) 最后从模糊区域分割出不可恢复部分。
总体上说, 用于图像分割的方法根据所要处理图像的特点各有利弊, 仅仅采用某种特定的图像分割方法不能达到所要获得的效果。因此可以结合多种方法的优点, 祛除不利的方面, 综合运用多种方法, 构造一种多级分割的立体体系结构。通过分割处理的图像不仅为后续工作节省了运算时间, 同时也提高了识别的准确性。
3 图像增强
通过对某型经纬仪设备拍摄高速运动目标图像分析, 可使用较为简单但有效的灰度变换进行图像增强处理。利用matlab图像工具箱提供的函数imhist () 观察Mr.bmp的直方图。
为了将图像中有用的信息抽取出来, 剔除无用信息的灰度区间, 通常使用分段线性变换的方法, 通过将整个灰度值的区间平均分成若干条线段, 并将每一个直线段同一个局部的线性变换关系一一对应。
采用这一方法的好处是可以根据实际目标特性需要, 调整目标的灰度细节, 可以将无关信息的灰度区间删除, 突出所需目标相关信息。
MATLAB软件中, imadjust函数可以实现图像的灰度变换, 通过直方图变换调整图像的对比度。由于原始图像的灰度较暗, 对比度不够强烈, 所以调用Matlab图像工具箱提供的函数imadjust () 对其进行修正。通过对使用需求的针对性分析, 可以充分利用图像中的亮度信息, 明显改善图像的清晰度和对比度。
4 图像分类匹配
特征提取能够将所需要处理目标的图像信息, 通过数值特征用唯一的形式表达出来, 尽最大可能地保留所需信息, 删除无用信息。在高速运动目标模糊图像智能识别增强方法研究中, 如何减少识别时间、降低计算复杂度, 提高最终识别能力, 这些都需要将获取的图像精确、快速的地归类进入到已存储在计算机中的不同目标属性的图像数据库中, 通过多次处理最终形成的数据信息要与数据库中存储的若干目标图像信息进行匹配和比对, 通过计算它们之间的相似程度和特征点, 识别出获取图像的属性信息。
5 结语
图像智能识别增强技术实现的方法有许多种, 只采用某一特定方法难以取得良好效果, 这里只是提供了一种可能的选择。采用更实用、简便的图像处理算法, 在减小计算量的同时提高识别率和识别速度, 最终通过图像识别和增强处理, 提高判读效率和准确性是下一步研究的重点和方向。
参考文献
[1]杨小冬, 宁新宝.自动图像识别系统图像分割算法的研究[J].南京大学学报, 2004, 40 (4) :424—431.
[2]基于自相关的匀速运动模糊尺度参数识别[N].国防科技大学学报, 2006.28 (5) :123-125.
试析图像处理的盲道识别算法 篇4
关键词:图像处理;盲道;识别算法
前言
我国当前大多数城市的盲道并没有得到最大限度的使用,为了使其更好地发挥作用,需要一种实际有效的方法来提高盲道的使用率。目前可实行的方案就是在盲道中植入一种电子信息引导系统。但是它的实行仍然需要很大成本,因为这需要大规模地重建现有盲道,需要重新改造路面建设,显然不是最优方案。而基于图像处理的盲道识别系统具有相对的可行性。本文提出的识别算法,及其开发的完整的导盲系统针对不同的盲道,具有高度的灵活性。例如,电子导盲拐、导盲鞋的发明,车辆自动导盲等等。相比与大规模重建盲道,这种电子图像处理的方案显然成本更低,而且它与车辆导航系统具有相似性,因此更有研究价值。
一、盲道识别的重要性
1.安全需要
根据马斯洛的需求层次理论,人类的需求由低到高呈阶梯型分布,依次为生理需求,安全需求,安全需求,社会需求,尊重需求以及自我实现的需求。由此可见,在满足了人类最基本的生理需求的基础上,安全需求就成为最需要被考虑的方面。生存权是人类最基本的权利,盲人更需要这种基本的人权,同时也需要更多的尊重,因此盲道上的一切不安全行为都应该被禁止。
2.出行需要
人不是独居的动物,需要出行以融入集体的生活。因此出行变成了最基本的社会生活之一。尤其是盲人的出行条件和便捷性更应该被优先考虑。社会上的弱势群体他们生活不便,行动不便,因此更需要正常人为他们的生活开辟出一条便捷通道。盲道道路条件应该得到全面的保障,尽可能减少阻塞的情况,也应该尽可能地减少被侵占甚至破坏。
3.审美需求
盲道建设作为城市道路建设的一种形式,不能只考虑其便捷性而忽略了美观性。旨在保证盲人等残障人士安全出行的基础上,尽可能地满足其心理需求以及身体舒适度。一个良好的盲道空间环境的设计应该综合考虑气候因素,街道设施齐备度以及噪音影响度等因素,通过植物景观和建筑物的协调规划,同时避免阳光暴晒或者过于阴暗,以及强风强雨、环境严重污染等因素,给盲人提供最大限度的良好出行体验。
二、盲道识别算法
1.盲道识别算法的定义
车辆导航系统常用的道路识别系统实际上基于道路的边缘识别跟踪,唯一的不同就在边界的检测算法上以及对边界曲线的建模上。盲道识别算法实际上与此技术类似。盲道边界线的确定可以通过图像处理中的一些算法将图像中的人行道与忙到区别开来。相应的,边界线被检测出来以后,盲道与人行道的区域就能被较容易地分立开来,也就可以知道盲道的建设是否偏离了其行进方向,并且精准测量其偏离角度,预测其接下来的拐道以及及时作出警告。这种识别算法的核心要点就是如何能高效地找到盲道与人行道的分界线。
2.盲道识别算法的类型
1)标准意义上的盲道建设通常会使用颜色较深的盲砖,这种情况下的盲道边界比较容易识别。可以通过有色区域的颜色差异来进行图像的分割,进而确定盲道边界线。
2)铺设盲道的盲砖的纹理与普通人行道的纹理有所不同,基于纹理的盲道分割法就可以从纹理的不同上将盲道从图像上分割开来,从而确定盲道边界。
3)盲道边界的确定可以利用Hough 直线检测的方法来达成。
三、盲道识别算法的应用
目前盲道识别算法主要有三种,即基于颜色区域的图像分割,基于纹理区域的图像分割,基于直接 Hough 的直线检测分割。由于三种方式的针对要素不同,它们的使用以及工作程序也有所不同。
1.基于颜色区域的图像分割
盲道是现在市政公用工程中的重要项目之一,那么一些专业人员对于盲道颜色区域的图像的分析做出了很多种识别方法,比如利用颜色比较鲜艳的黄色或富有饱和度和亮度的红色,再将这些道路设计出凹凸状,以便于盲人感官的识别。针对场景较为复杂的彩色图像可以采用彩色纹理区域分割的算法。无论用什么盲道识别算法,都必须高效地分割盲道与人行道,同时还要分析盲道的结构特征。这样的要求下最适合的莫过于自适应阈值分割的算法。
盲道图像的采集往往发生在人行道区域与盲道区域内。为了更加便捷有效地进行分割,往往将这个图像分为两个部分,每个区域都有自己的相对确定的颜色,相似的颜色区域有其特殊的分割算法。只要图像被分割成颜色面积最大的两个部分就可以进行盲道识别。自适应阈值分割法也适用于这样的情况,同时它最简单,成本最低,效果也很明显。通常情况下的盲道区域是深黄色,条形纹理设置于直行区域,圆形纹理设置于拐弯处。
有显著颜色差异的盲道图像可以用HSV颜色空间的描述来转换,在色相空间用阈值分割的方式将盲道准确定位并分割出来。HSV颜色空间中,色相。饱和度以及亮度是描述颜色特征的三大形式。色相明显度可以定位坐标系中的角度,颜色的差异越显著其色相分量也就相差越大。利用阈值分割可以直接划分出色相强度的区域,再转为二值图像然后检测边缘,最终确定盲道边界。
2.基于纹理区域的图像分割
盲道识别算法中基于颜色分异来划分是最直接有效的方法,可它并不能适用于所有的盲道识别分割,因为并非所有的盲道与人行道都有明显的颜色区别。有时候盲道的颜色与人行道的颜色非常相似,只是盲道有凸出纹理,而人行道是平滑无凸出的。在这样的情况先,只能用基于纹理的盲道识别算法来分割忙到区域并且对其边界线进行检测。
与基于颜色区域的图像分割法相似,纹理分割法实际上也有很多种算法,但无外乎都有两个过程,基于建立纹理特征的模型和聚类两部分。盲道的纹理特征主要表现在模型的分割、特征值的分割和结构的分割。具体就是在实际操作中做一个符合盲人感观的图形,如条形状、方块状、不规则的凹凸状,然后在从图形中計算出地域和时间的相对恒定的特征值,再用这些特征值来注明某个地域的性质区别,最后用结构分割法将图像的结构大小分割开来,再用规定的方法排列成新的特征,从而进行识别。利用一种典型的逐点修改迭代的动态算法,即K-means 的聚类方法,可以实现特征聚类过程。对于差异较大,纹理基元大小难以估计的盲道,通常使用基于特征的纹理提取算法。
3.基于直接 Hough 的直线检测
基于颜色区域的图像分割与基于纹理区域的图像分割并不能解决所有盲道识别的问题,尤其是针对盲道上结构性较强的宏纹理的测量结果往往不准确。这种情况下基于直接Hough 的直线检测就显得非常重要。比如颜色与人行道颜色非常接近的盲道,其凸出纹理与人行道地砖的纹理也非常相似,那么基于纹理的分割方法就难以精确分割盲道边界线。但是各个砖块之间有明显的缝隙,根据其梯度的变化来找出边缘界线就相对简单易行。
只要找到其中一条边缘线,就可以提取出盲道边界。
四、讨论
基于颜色区域的图像分割、基于纹理区域的图像分割、基于直接 Hough 的直线检测是盲道边界识别分割的三种常用方法。从一些盲道的采集图像中可以看到城市中大多数盲道的颜色与人行道的颜色具有显著的差异,纹理差异显著的盲道也有很多。三种方式在不同的盲道识别中有不同的适用范围,在相匹配的盲道识别中将发挥其不可替代的作用。(作者单位:四川大学电子信息学院)
参考文献:
[1] 徐杰,李晓虎,王荣本,等.车辆自主导航中的道路边界识别算法[J]中国图像图形学报,2003,8(6):674-678.
[2] 袁小萍.试论ATM 案件的作案手段及侦查思路[J]犯罪研究,2005,(4):56-62.
[3] 周小四,王淑华,杨杰.数字图像监控网络报警系统设计[J]计算机工程,2002,28(4):61-63,101
智能图像识别 篇5
RFID作为二十一世纪发展最快的高新技术之一, 在美国国防部及商界巨头沃尔玛等企业的积极推动下, 电子标签 (即无线射频识别技术) 的应用已被国际上列为本世纪十大技术趋势之一。这一全球性的应用浪潮, 同时也带动了相当多中国企业的及时跟进。
RFID标准体系主要由空中接口规范、物理特性、读写器协议、编码体系、测试规范、应用规范、数据管理、信息安全等标准组成。低碳交通区系统主要由环保电子标志、车辆感知基站、环境监测基站和监管控制平台四个部分组成。
电子环保标志采用900MRFID电子标志, 它包含车牌号、车型号、排放标准等车辆信息, 并且具备唯一识别码, 代替原有的常规纸质环保标志, 与汽车形成唯一的对应关系。
车辆感知基站采用双基识别技术 (即视频+射频) , 通过射频识别可实现对电子标签的非接触自动识别, 能够远距离 (最大15米左右) 对高速行驶 (180公里/小时) 的车辆上的电子标志进行检测和读写。通过视频识别, 实现车牌识别、拍照取证, 并能与射频识别结果匹配。
环境监测基站建立在道路两侧, 能够实时检测、预警城市路网的机动车污染状况。
监管控制平台是低碳交通区系统的大脑, 负责对传输过来的识别信息和环境信息进行智能分析, 协同环保与公安业务处理平台, 实现低碳交通区监管业务分析及处理。
交通拥堵与污染共生, 越是拥堵, 污染越严重, 对人的危害越大。通常情况下, 车辆以20公里/小时速度行驶时的尾气排放量是40公里/小时时的一倍以上。以电子环保标志为载体, 利用物联网技术, 建立智能交通系统, 对交通综合信息进行采集、组织、分析, 根据道路拥堵状况进行交通调控, 使路网上的交通流运行处于最佳状态, 从而改善交通拥堵, 降低机动车污染。据估算, 能减少机动车污染物排放15%~20%。
高污染黄标车是指排放标准达不到国I的机动车, 无标车是指未经环保年检或环保年检不合格, 无法领取环保标志的车辆。黄标车和无标车虽只占城市机动车总量的10%~15%, 但排放的污染物却达机动车排污总量的50%。利用电子环保标志和物联网技术建立的区域限行系统, 可实现机动车信息系统、环保监管系统和道路通行系统的三者联网, 从而实现车辆标志识别判断的唯一性, 提高限行管理的准确性和高效性。
建立道路两侧环境空气和机动车污染监测体系, 实时检测预警城市路网的机动车污染状况。结合智能交通系统, 利用电子环保标志信息对车辆通行实施智能调控, 建立全国统一标准和内容的电子环保标志制度。路检执法人员配置相关读写仪器或手持PDA, 可实现各城市之间的标志互认, 真正达到联防联控的目的。通过开发环保、公交、城建等多部门的信息集成平台, 实现电子标志信息快速共享、对车辆的城市综合管理, 如交强险、自动收费计次等。RFID在低碳交通建设中应用于绿色智能交通系统的建设, 实现治堵和治污双赢。随着城市管理措施的日益丰富和完善, 交通管理的规则也变得更加充实。智能交通安防技术也日益科学化、通用化。智能交通在我国快速发展, RFID技术应用同样如日中天。无线射频识别技术RFID是一种非接触式的自动识别技术, 它通过射频信号自动识别目标对象并交换相关数据, 识别工作可实现物物交换数据, 可工作于各种恶劣环境。RFID技术具备高速移动物体的识别功能, 可同时识别多个标签, 具备数字化、可视化等功能。
RFID系统由电子标签、读写器和控制主机组成。RFID技术的工作原理如下:读写器按照一定频率发送固定频率的电磁波, 电磁波会与射频卡振荡电路产生共振, 射频卡将芯片中的电子编码信息发送给读写器后, 送至控制主机进行数据处理。RFID (无线射频识别) 技术当前已在流通领域的跟踪管理, 工业自动化领域的生产管理, 自动结算领域的票务管理, 身份验证、防伪与资产管理, 军事装备可视化等领域得到广泛应用。
图像识别技术是人类利用计算机对现实图像进行分析和处理的技术。它在分割的基础上选择需要提取的特征, 并对参数进行测量和提取, 根据分析结果再作分类。图像识别技术缺点是受恶劣环境影响大, 如大雨、大雪、迷雾严重影响检测效果;邻近路线的车辆间隔较小时容易受干扰;光线变化、车辆与路面的对比参照、盐垢或摄像头表面的污迹等, 都会影响检测的有效率。由于RFID系统具有车—路通信、自动识别、点定位、远距离检测及可视化等功能, 在移动车辆的自动识别与管理系统方面, 有广阔应用市场, 成为智能交通重要应用技术之一。随着RFID芯片、读写器和天线技术的不断提升, RFID技术在高速、远距离识别、读写方面有了快速的提升, 非常适合在道路交通管理中使用。
通过对各个线路的数据收集, 政府的城市交通管理部门工作人员便拥有了真正的可视化监督管理工具, 并且直观、真实、可靠, 能够比较全面而客观地反映出当前城市公共交通存在的各种现状和问题, 从而促使其加大力度进行维护和改善。无论是当天实时的交通信息, 还是一个阶段积累后所获得的历史数据, 都可成为城市各条线路运营质量评估的参考依据与评价标准。对于运营状况不佳的, 可及时加以整改, 调整线路或停止运行;对交通不方便的路段, 增加基础设施建设或整修道路。此外, 综合各条线路的运营状况, 交通管理部门可以整体评估城市公共交通的现状, 为公共交通问题的进一步发展与改善提供思路。
无线射频识别技术 (RFID) 是一种非接触式的自动识别技术, 它通过射频信号自动识别目标对象并获取数据信息。识别无须人工干预, 可工作于各种恶劣环境, 并可同时识别多个目标对象, 操作快捷方便。一般的RFID系统由电子标签 (Tag) 、阅读器 (Reader) 、天线 (Antenna) 三大部分组成。RFID技术具有防水、防磁、耐高温、使用寿命长、读取距离大、标签上数据可以加密、存储数据容量大等优点, 其应用将为智能交通管理带来革命性变化。目前, 发达国家在智能交通方面已开始推广应用RFID技术。随着该技术的日趋成熟, 国内开始逐步在门禁管制、仓储物流管理、航空行李分拣和智能交通管理自动收费等领域得到一定的应用。然而, 对于智能交通管理上的应用还只是凤毛麟角, 只有几家RFID业内公司提出了各自的公路/车辆RFID管理系统。通过对车辆进行非接触式信息采集处理, 从而自动识别和自动管理车辆活动, 例如不用停车便可收费的ETC系统等。
智能图像识别 篇6
1 本课题研究目的和内容
1.1 研究目的
研究一种基于Android手机的手持式电能表计量误差检测程序, 电力员工通过手机对电能表脉冲灯进行摄像, 结合电流表和电压表, 可以很容易地排查窃电行为, 避免使用专业设备的各种不足, 为电网挽回经济损失, 保障用电安全。
1.2 研究内容
(1) 研究电能表脉冲灯图像识别算法。电能表脉冲灯在闪烁的时候, 具有亮度、颜色和形状3种特征。根据图像处理和图像识别算法, 采用灰度变化、灰度直方图均衡化、色彩空间变换、形态学滤波、形状特征检测、模板匹配和帧差法等多种方法处理拍摄的脉冲灯图像, 识别出脉冲灯亮灭与否, 从而为计算出脉冲灯闪烁频率提供理论基础。
(2) 研究基于Android手机的电能表误差检测应用程序。根据上述电能表脉冲灯图像识别算法, 在Android手机编程的基础上, 设计应用程序界面、操作流程等, 编写应用软件。电力员工通过在手机上安装检测软件, 就可以检测电能表的计量误差, 从而判断用户是否存在窃电行为。
(3) 研究上述检测软件的精度与示范应用效果, 并进行推广应用。请专业的检测部门对检测软件进行鉴定, 判断是否达到应用要求。对检测软件进行示范应用, 评价应用效果, 为推广应用做好铺垫, 并分析检测软件的推广前景。
2 Android计量误差检测软件开发
2.1 总体结构设计
根据程序设计原理, 在使用程序时要输入电压表和电流表读数值等, 所以程序需要设计2个界面, 即2个Activity。在程序打开时, 显示参数输入界面, 提示用户输入相关参数。然后按下按钮, 转入摄像头拍摄界面, 识别电流表计量值, 然后通过将测量值和识别值做比较, 判断电能表计量误差, 判断是否存在窃电行为。
程序UI (User Interface) 如图1所示。从图中可以看出, 程序包含2个界面。在初始界面, 提示用户输入电流值 (A) 、电压值 (V) 、电能表转速 (r) 等3项参数, 然后程序会自动计算理论功率值, 在计算功率值时, 低压侧功率因数可以认为1, 直接计算电压电流值乘积即可。然后用户设定记数次数 (帧数) 。当用户点击开始测算按钮时, 程序进入第二个界面, 首先要选择场景, 图中彩色代表只能用颜色特征的特殊情况, 灰度代表一般情况, 也是默认选择。选择好场景后, 点击开始, 启动摄像头拍摄, 达到设定次数 (帧数) 后自动处理处电能表偏差值, 并显示。在测算后, 用户可以点击返回, 进行第二次测量, 也可以中止程序运行。
2.2 系统使用方法
装置:安装了检测软件的手机、电压表、电流表等工具。
方法:首先使用电压表测量用户侧电压值, 然后使用电流表测量用户侧电流值, 最后打开手机上的检测软件, 输入相关参数, 在一定距离内对电能表脉冲灯进行拍摄, 拍摄完毕后, 根据软件提示结果判断用户是否存在窃电行为。
2.3 系统的精度测定实验
委托国网河北省电力公司电力科学研究院计量中心对该程序的误差进行了检验。检验采用了计量中心专业校验实验台, 分别对同一块表计进行了误差测量。经检测, 手机程序测量误差精确到0.1%, 完全符合低压居民用户电能表误差在1.0级以上 (1%) 的要求。应用该程序测量的表计误差与专业实验装置测量的表计误差, 两者最大偏差为0.59%, 最小偏差仅为0.02%, 平均误差为0.18%。检定地点:关口表实验室、指示仪表实验室;温度:20℃;相对湿度:60%;检定频率:50Hz。
2.4 实际使用
程序界面友好、操作简便安全、测试结果准确。利用该程序测量表计误差, 无需使用专业检验装置、无需打开表箱、无需拆除表封印、无需接线, 仅需1人使用1台安装了该程序的智能手机, 配合1台钳形电流表, 即可在1 min内完成电能表计误差的测量。由于钳形电流表配置较为普遍, 用电检查人员及农电工基本人手一台, 且目前智能手机应用广泛, 该程序已通过安卓程序市场网站审核, 用电检查人员和农电工可免费下载。因此, 公司系统员工可自行下载该程序, 使用随身携带的钳形电流表, 随时可进行低压用户营业普查工作。该程序大量应用, 使得大范围开展低压用户营业普查更易于开展, 同时, 也将给低压窃电用户造成心理震慑, 减少窃电事件的发生。应用该程序校验表计误差与传统校验方法对比测试结果如表1所示。
3 结果分析与推广应用
3.1结果分析与示范应用
通过以上实验结果表明:本检测软件在精度上符合相关标准要求, 可以达到使用要求;相对于传统检验方法而言, 本装置具有成本低、检验快速、耗时短等优点, 满足使用要求, 能够解决当前窃电检查所遇到的各项问题, 有很大的应用价值。
用本检测软件在晋州市供电公司组织各供电所对部分高损台区全部低压用户开展了用电普查, 共查到窃电用户206户, 追补电费及收取违约使用电费17.48万元;同时, 准确查出故障表计132块。截至目前, 该程序访问量达7.2万余次, 下载量突破4.4万次, 并获得了用户的广泛好评。
3.2 推广应用
智能图像识别 篇7
关键词:TSL1401CL,MC9S12XS128,智能车
0引言
目前,具有自动驾驶功能的智能车越来越引起人们的重视。智能车装备了各种传感器来采集路况信息,通过计算机的控制可以实现自适应巡航,并且又快又稳、安全可靠。智能车不仅能在危险、有毒、有害的环境里工作,而且能通过计算机的控制实现安全驾驶,能大幅度降低车祸的发生率。智能车的设计关键是路况信息的采集,传统的方案多采用红外光电传感器[1,2],此方案不仅噪声较大,而且与主控CPU的连接电路复杂,传输速率慢。本文研究的智能小车系统选用了TSL1401CL线性CCD图像采集模块,该模块采用串行通信方式与主控CPU连接,不仅电路简单、性能稳定,而且采集速率快。通过实验测试,本文设计的智能车能根据采集到的图像分析前方路径及障碍而实现智能驾驶,具有极强的实用价值和市场前景。
1 系统设计思想
经过调研与分析,我们采用了MC9S12XS128单片机、TSL1401CL线性CCD图像采集模块、稳压芯片以及液晶OLED等外围器件设计与开发出这套智能小车系统。MC9S12XS128高速单片机为Freescal公司新推出的16位高性能高速单片机,其接口丰富、功耗低、信息处理能力强大,能对小车前方路径及障碍进行及时分析,处理迅速、性能稳定。为了提高路面图 像采集的 速度与质 量 , 我们选用 了TSL1401CL线性CCD图像传感器。TSL1401CL具有功耗小、性能稳定、灵敏度高、响应速度快等优点,其工作过程是先将路况光学信号转换为模拟电流,模拟电流放大后再进行A/D转换变成数字信号,最后通过串口送至主控CPU。智能小车的CPU根据CCD采集到的信息进行分析和处理,从而实现系统的自动控制与障碍处理、路径探测。在软件设计中我们采用了先进的PID(比例、积分、微分)算法,其运算参数可以根据过程的动态特性及时整定。通过PID算法,模糊PID算法来实现智能车的转向、控速等精确自动控制,另外还有很好的避障功能,实现了全智能的安全控制。
2 系统硬件设计
本项目采用模块化设计与开发,主要有CCD采集模块、电源模块、电机驱动模块、车速控制模块和转
图1系统总体设计框图 (参见下页)
2.1 CCD采集模块
该模块采用TSL1401CL线性CCD图像传感器,其内部由一个128×1的光电二极管阵列、相关的电荷放大器电路和一个内部的像素数据保持功能组成,它提供了同时集成起始和停止时间的所有像素。对于TSL1401CL线性传感器的驱动与使用,本项目利用MC9S12XS128的PA0和PA1引脚对其CLK和SI两个引脚按特定的时序发出方波信号,TSL1401CL的AO引脚就会依次输出128个像素点的模拟信号给MC9S12XS128,其电路如图2所示。我们通过测试发现,该传感器的输出信号和环境光线密切相关,白天AO输出值比晚上高很多,对光和背光相差也很大,白炽光和日光灯光线条件下差异很大。同一镜头或信号放大倍数,必然无法适应各种环境,经常会出现过弱或信号饱和,对环境的适应性很弱,对此可通过软件使用动态曝光时间或通过单片机动态改变运放的放大倍数。
2.2 电源模块
系统由不同的模块组成,每个模块工作的电压不同,设计时还要考虑各模块所需的功率。另外还需设计电池检测系统,以便直观了解电池的情况。智能车需要的电源要求包括5V、7.2V等。对于5V供电设计我们选择了LM2940-5,对比7805,2940的优点是低压差稳压,其稳压差小于500m V,这样保证电池在低电压的情况下仍能使单片机和传感器正常工作,同时,LM2940的输出电流可以达到1A,足够供应放大电路和键盘显示电路的工作。LM2940模块电路设计图如图3所示。
2.3 电机驱动模块
驱动电路为智能车驱动电机提供控制和驱动,这部分电路的设计要求以能够通过大电流为主要指标。驱动电路的基本原理是H桥驱动原理,目前流行的H桥驱动电路有:H桥集成电路,如MC33886;集成半桥电路,如BTS7970以及MOS管搭建的H桥等电路。对于本系统的设计,我们选择了性能较好的BTS7970作为电机驱动模块的主芯片,其工作电路图如图4所示。
2.4 速度控制模块
智能车的车速主要采用增量式PID控制和位置式PID控制,将模糊控制与PID控制相结合,使智能车能够在赛道上平稳快速地行驶。智能小车速度控制系统以XS128单片机为核心,由单片机给电机一个给定速度即理论速度,建立模糊PID控制器,利用模糊PID控制器来控制电机的转速,即控制智能小车的实际速度。再利用光电编码器来测量智能小车的实际车速,并将实际车速反馈给模糊PID控制器,形成闭环负反馈回路。
2.5 转向控制模块
智能车的舵机SD-5采用位置式PD控制,因为舵机的控制精度高,不同的PWM占空比对应舵机的不同转角,所以采用开环控制。当小车位于直道时,将舵机摆正;当小车位于弯道时,弯道的曲率越大则舵机的转角摆角越大,利用图像的加权平均偏差与图像中心之差作为控制量。
3 系统软件设计
系统软件采用C语言编写,通过Code WarriorIDE编译。软件设计的思想是驱动线性CCD光学器件采集单线图像信息,通过处理采集到的图像来判断小车所处的位置和确定小车行进时前进方向上的路线情况,然后将处理后的信息转化成变化的PWM量发送到舵机和电机以及编码器处理模块,从而达到对小车行走方向及车速的控制。系统流程图如图5所示。
4 总结
智能图像识别 篇8
一、图像识别技术
图像识别技术主要包括统计法、神经网络结构法三种。统计法的优势在于通过数学模型的建立对图像进行线性区分, 但缺点是无法识别图像的具体内容。随着科技的进步, 神经网络等方法开始应用于计算机图像识别, 提高了其智能化程度。在医药工程、建筑工程等多个方面, 图像识别技术得到使用和推广。
二、智能化图像识别技术的运用
图像识别技术已经广泛的应用于医药工程、文学艺术等多个领域, 具有积极的作用。当然, 其技术还需要进一步突破。文章将其在不同领域的应用效果进行分析, 以找到技术革新的突破口。
2.1智能化图像识别技术应用于医药工程
医学上的红细胞以及染色体的识别都依赖于图像识别, 通过智能化的图像识别技术, 医生可对患者病情进行正确把握, 从而促进医学手术的成功。智能化图像识别技术在医学上的应用始于目前, 还需要进一步的技术调整。
2.2智能化图像识别技术应用于建筑工程
对于建筑设备零件的检测上智能化图像得到了广泛的应用, 其对运行设备故障的检修具有积极的作用。同时, 施工过程中的装配、焊接等过程均用到了智能化图像识别技术。确保整个建筑施工工程完整。
2.3智能化图像识别技术应用于文学艺术设计
文学艺术领域的智能化图像识别技术应用主要体现在电视节目制作上。图像处理的技术高低直接影响了电视画面的效果。这就要求其必须实现智能化才能避免人工操作中存在的弊端。同时这一技术在体现美的服装行业上也具有较多的应用, 艺术的发展离不开图像, 而图像的处理技术则只有在智能化的基础上才能不断提高, 这是现代科技发展与智能化基础作用之间的矛盾。
三、计算机智能化图像识别技术的突破
3.1高速化和标准化识别技术的出现与应用
计算机的运行速度对生产、生活具有十分重要的影响, 图像处理技术也要逐渐实现标准化和高速化, 这样才能体现出其效率。随着现代计算机配置的提高, 图像识别技术的发展应越来越细腻, 图像采集的分辨率应逐渐提高。存储图像的设备也应不断的更新。
而二维图像识别分析将被淘汰, 替代它的将是三维立体图像识别, 这样识别速度更快, 效率更高, 识别技术将在细节上进行改进, 满足多个领域的需求。当然, 多媒体形式的计算机图像处理方式将在未来图像处理中占有一席之地。数据处理和数据压缩将可通过多媒体进行信息转换, 计算机图像识别不再是通过机器, 而是将人类的思维与其紧密的结合在一起。其目的在于获得更加精确的图像识别, 将图像识别技术渗透到生产生活中的各个领域。
3.2多维度和高科技智能化图像识别技术的出现和发展
计算机信息处理技术从二维到三维转换的过程中, 其准确度不断提高。但对其技术的要求也逐渐提高, 这就要求计算机硬件和软件也要不断的提高, 最重要的是中央处理器功能要不断的提高。伴随着科技技术革新以及人们需求的改变, 计算机图像处理过程应侧重于更详细的分类, 系统化的、个性化的图像处理将成为行业发展的主流。
四、总结
计算机图像识别技术的作用已经十分明显。但无论是技术上, 还是在效果上其发展还具有一定的差距。尤其是对于我国的计算机图像识别技术, 与发达国家存在很大的差距。因此其在技术上要进行突破。
因此文章针对图像识别技术的原理, 分析了图像识别技术的发展方向, 对其技术突破方面做了大胆的假设。目前, 图像识别方式已经越来越丰富, 但其在专业技术上却并不精细, 如何将每种方案的技术做到精细, 是现代图像识别技术的主流发展方向。
参考文献
[1]孙妍姑, 基于BP神经网络的图像识别技术研究[J].淮南师范学院学报, 2010 (05) 22-23.
[2]成金勇, 范延滨, 宋洁.基于小波分析与Snake模型的图像边缘检测方法[J].青岛大学学报, 2012, 3:78-81.
智能图像识别 篇9
【基金项目】
符振艾,湖南省科技厅计划项目;基金项目编号:2014GK3040基于生物特征提取的人脸识别系统设计技术研究
赵微。湖南省科技厅计划项目;基金项目编号:2014GK30401智能银行视频监控系统设计与研究
刘绪崇。湖南省科技厅重点项目:基金项目编号:2013GK2014骨干互联网安全检测与态势评估预警系统
基于人脸图像的性别识别、年龄估计在相关领域已经形成研究热潮,而且以往是研究也都取得了不错的成效。虽然在日常生活中我们根据人脸判断其年龄、性别很容易,但若使计算机有此能力还面临巨大的挑战,文章将重点探究基于人脸子区域的性别识别和基于人脸图像的年龄估计。
一、基于人脸子区域的性别识别
脸部子区域分割。进行脸部的子区域分割,首先是要将给定的人脸图像转换成灰度图像,然后在对灰度图像进行处理——缩放、平移和旋转,要使图像中人的双眼处于固定的位置,再从背景中分离、切割出整个包括头发在内的人脸区域,最后降低关照影响,可用直方图均衡化来处理。对于初步处理的人脸区域图像,再将六个子区域切割出来,主要包括:脸部区域,脸上下半区域,嘴巴、鼻子和左眼区域。
由于人双眼的对称性,可选取左眼为眼睛部分的子区域。主要分析研究的是性别识别受到各人脸区域的影响大小,并进一步探讨提高性别识别准确性的方法,可以进行贡献较大的脸部子区域的融合。因而要手工切割出人脸图像中的子区域。在实际应用的过程中,进行性别的自动识别,可对视频采集到的图像用Adaboost 快速人脸检测算法快速检测出图像中的人脸,从背景中将人脸切割出来。继而进行双眼的定位,可用眼睛定位法来确定位置,寻找脸部主要特征点可以采用AAM算法。寻找出脸部特征点之后,再根据这些位置进行各子区域图像的进一步切割。
基于子区域融合的性别识别。有关研究证明,相比较整张人脸来说,脸部是局部区域受人脸表情变化的影响更小一些。该文原载于中国社会科学院文献信息中心主办的《环球市场信息导报》杂志http://www.ems86.com总第543期2014年第11期-----转载须注名来源就微笑这个表情来说,往往人脸的下半部分变化较大,特别是嘴巴和脸颊的变化,而上半部分尤其的鼻子的变化相当小。因此,实现性别识别可以通过脸部子区域特征的融合来进行。
对于脸部子区域对性别识别的贡献大小的研究,进行的实验采用的是基本不带表情的正面人脸图像即,这一实验也就是研究与性别相关的信息在脸部子区域包含了多少内容。而基于子区域融合的性别识别方法的验证要通过在表情变化情况下进行实验,这样相对于用整个人脸图像进行性别识别来说,具有更高的准确率。
二、基于人脸图像的年龄估计
人脸年龄特征。随着年龄的增长,人脸的外观也会发生变化,在皮肤、颅骨形状、肌肉松弛度方面都有主要的体现。Narayanan Ramanathan 等人就对人的颅骨骨骼形状进行了研究,分析观察其随年龄增长而产生的变化,因而由此提出了颅面成长模型。通常而言,颅骨骨骼会随着年龄增长而变化,但变化往往只会持续到 18 岁,人脸颅骨在人18岁之后基本不会有太大的变化。由此可以发现脸部变化在18岁以前脸部特征点和比例变化是主要的体现。而18岁之后主要是通过脸部纹理的变化来体现年龄脸部的变化。
研究表明,人脸各个部位对于人脸识别的贡献率大小不同。我们根据日常生活来看,似乎通过对眼周围区域的直观感觉更容易识别人脸,下半部分人脸和鼻子、嘴巴对人脸识别的作用更小一些。但人脸的年龄估计不同于人脸识别,而关于人脸年龄自动估计技术自然也是不同于人脑的直观判断。那么哪个区域在人脸自动年龄估算中具有更强的信息表达能力。所以,首先进行人脸各局部区域在机器识别中的贡献率的研究,将有助于在识别中有效地选择局部特征。
脸部特征提取。与依据人脸图像来进行表示不同,既是策略上的不同,又是重点的不同。进行模拟识别时,提取人脸特征的提算方法可分为:一类是基于全局特征的算法,这种算法更倾向于把人脸视为一个整体,再进行计算分析,但由于受表情、光照等一些因素的影响,人脸的识别结果会因此受到很大的影响。还有一类是基于局部特征的算法,这也是人们针对前者存在的弱点提出的方法,顾名思义就是提取人脸图像的局部特征,继而进行针对性的分析计算,对局部特征的利用,得到的人臉表示更加鲁棒,表现出更明显的进行识别的优势。研究发现,对于某些人脸图像的识别结果,基于全局特征进行的分析不正确,而基于局部特征进行的分析却是正确的。基于人脸图像的年龄估计,具体方法可先采用 2DPCA 将人脸图像的全局特征提取出来,然后对脸部的局部特征进行用Gabor小波的变换提取,加之以眼睛区域——与年龄特征关联最紧密,最后的融合在决策级进行。
性别识别与年龄估计的级联。事实表明,同一年龄段的男性和女性,他们的脸部在年龄特征上有很大的差异,实际生活中,人们自然也不会把男女放在一起进行年龄的估算。性别信息作为一种先验信息,因而对于年龄估计非常的重要,可以使人脸年龄估计的准确率大大提高。可在性别信息作为先验信息的前提下,来进行年龄分类的任务分解。可以根据性别将不同年龄类别中的人脸图像分为两个子集,任务分解之后再集合训练样本,将其输入SVM中再进行学习。可以先判断新人脸图像的性别再进行年龄估计。
人脸作为人最重要的生物特征之一,包含了年龄、性别在内的很多重要信息。计算机技术的迅猛发展使得基于人脸的识别技术成为研究的重要内容,人脸识别、表情识别、年龄估计等都是其研究的重要识别技术。本文研究了基于人脸的年龄识别和年龄估计等方面的内容,也就是对输入的人脸图像利用计算机来进行其性别的识别与年龄的估计。文中依旧有不足的地方,希望为以后的研究提供一定的借鉴。
智能图像识别 篇10
随着计算机的发展, 在各个领域中都得到了很好的应用, 作为一门发展时间较短的学科, 计算机自身还有很大的进步空间, 在将来很长一段时间内, 都会是非常热门的学科。现在看来, 计算机的发展方向是智能化, 由于计算机硬件的架构很难进行变化, 因此计算机的智能化主要依靠软件来实现, 目前已经出现了带有人工专家模块的智能化软件, 这些软件可以对一些问题进行分析, 从而给出一些建议, 由于智能化技术还不是很成熟, 应用的范围并不是很广泛。图像的识别和处理是近几年才兴起的一门技术, 由于其自身的特点, 被很多领域所关注, 现在简单的图像识别技术已经比较完善, 人们希望图像识别也可以具有一定的智能化, 从而更好的在各个领域中应用。
1 计算机图像识别技术分析
1.1 图像识别技术的概念
计算机图像识别技术是近几年才兴起的一门学科, 随着计算机性能的提高, 摄像头等硬件设备的发展, 为计算机图像识别技术, 提供了良好的基础, 在计算机出现的初期, 当时数字信号处理技术还没有出现, 因此图像在计算机中, 只能以模拟信号的形式存在, 对模拟的图像进行处理比较困难, 相应的图像识别也就具有一定的困难。数字信号处理技术, 就是将模拟的图像转化成数字的, 对于数字图像的处理非常简单, 还能够进行非线性的处理, 图像识别技术就是数字图像处理的一个内容, 对于人们来说, 对观察到的事物进行认识和分析非常简单, 但是要想让计算机识别一张图片, 就会有很大的难度, 图像识别技术就是对图像中的一个特点进行分析, 从而能够识别出图像中的一些内容。目前图像识别技术已经在很多领域中进行应用, 如密码锁、罪犯对比系统等。
1.2 图像识别技术的方法
在固定硬件架构的计算机中, 要想实现图像识别功能, 只能通过软件的方式来进行, 目前图像识别的软件技术, 主要有三种方法, 分别是统计、结构和神经网络法, 这些方法都具有一定的自身特点, 在实际应用的过程中, 应该根据实际图像识别的需要, 进行针对性的选择。在计算机图像识别的过程中, 识别的图像通常比较复杂, 在识别的目标和整个图像之间, 很难进行线性的区分, 这时就可以利用统计法, 建立一个数学模型, 对图像中的各个元素进行统计, 从而找出其中的规律, 这样的就可以完成图像识别的内容。由于统计法是在数学模型的基础上, 对图像中的内容进行识别, 没有对图像中的空间关系进行处理, 因此在应用上具有一定的局限性, 根据统计法中的不足, 人们研究了基于空间关系的机构法, 从本质上来说, 结构法是统计法的一种延伸, 使图像处理技术更加的完善, 能够应用的领域更加广泛。神经网络法是近几年才发展起来的一种方法, 这种方法根据神经网络的特点, 设置了很多节点, 在一个庞大神经网络的基础上, 可以完成非常复杂的图像识别, 由于神经网络是模仿人脑的特点, 因此可以具有一定的智能化, 这种方法是目前图像失败的主要方法。
2 计算机智能化图像识别技术的理论性分析
2.1 计算机智能化图像识别技术的现状
如何从一幅图像中识别出特定的目标, 是近些年来很多学者也专家研究的重点, 图像识别技术就是在这种背景下产生的, 经过了多年的发展, 现在已经开始在一些领域中应用, 但是通过实际的调查发现, 目前计算机能够完成的图像识别, 都是一些比较简单的图像。在实际的图像识别过程中, 人们根据图像的特点, 针对性的研究出了很多识别方法, 但是这些方法自身都存在一定的局限性, 对于特定图像的识别效果较好, 一些识别范围较大的方法, 通常需要很大的计算量, 而且自身比较复杂, 受到计算机性能等限制, 很难在实际中进行使用。这些因素都在很大程度上影响了图像识别技术的发展, 但是从整体上来看, 图像识别技术在不断的进行完善, 受到特殊的历史因素影响, 与日韩和西方发达国家相比, 我国的图像识别技术水平较低, 目前使用的设备和软件, 大多都是国外公司开发的, 要想提高我国的图像识别技术, 必须在图像识别的智能化发展中, 抓住机遇。
2.2 计算机智能化图像识别技术的理论性突破
现在的计算机图像识别技术, 基本都是对二维平面的图像进行分析, 对于三维空间下的图像进行识别, 目前还很难实现, 但是大型神经网络的出现, 给三维空间的图像识别, 提供了良好的基础, 而大型神经网络需要大量的计算, 这就需要良好的计算机性能, 从摩尔定律可以知道, 计算机的性能每隔十八个月就会翻倍, 经过了多年的发展, 现在的计算机性能已经非常高, 由此可以看出, 硬件和软件上的技术, 都已经相对成熟, 能够满足计算机智能化图像识别技术的要求。但是目前图像识别技术, 是建立在上世纪70年代的视觉计算理论, 受到当时技术条件的限制, 这个理论自身不是很完善, 其中一些内容还是在假设的前提下, 因此要想在计算机智能化图像识别技术的理论上进行突破, 必须对这个基础的理论进行完善, 根据现在图像识别技术的现状, 对视觉计算理论进行一定的补充, 然后在配合神经网络等优秀的算法, 这样才能取得智能化图像识别技术的理论性突破。
3 结语
计算机图像识别技术经过了多年的发展, 已经能够完成简单图像的识别, 并且在一些领域中应用, 但是通过实际的调查发现, 我国的图像识别技术还比较落后, 目前使用的图像处理系统, 大多都是从国外引进的。通过全文的分析可以知道, 计算机图像识别技术要依靠软件来实现, 现在有很多种算法可以实现图像的识别, 但每种算法都有一定的局限性, 要想提高图像识别的水平, 必须在神经网络等智能化的基础上, 在计算机的智能化图像识别技术的理论上进行突破。
摘要:受到我国经济起步较晚等影响, 与一些西方发达国家相比, 我国的计算机软件开发水平较低, 在一定程度上影响了图像识别技术的发展。本文通过分析图像识别技术的概念和方法, 得出了现在的图像识别技术正在向智能化发展, 我国要想在图像识别上取得进步, 就必须抓住这个机遇, 在神经网络等识别方法的基础上, 在计算机智能化图像识别技术的理论上取得突破。
关键词:计算机,智能化,图像识别技术,理论性,突破
参考文献
[1]杨青燕, 彭延军.基于灰度图像的答题卡识别技术[J], 山东科技大学学报 (自然科学版) , 2009 (03) :99-102
[2]马宁, 常骥.基于BP神经网络的手写数字识别研究[J], 哈尔滨师范大学自然科学学报, 2009 (04) :89-91