视觉处理

2024-10-11

视觉处理(精选8篇)

视觉处理 篇1

0 引言

21世纪以来, 我国在电子科学技术和计算机技术水平的飞速发展中, 人类社会的步伐逐渐走向了一个高速化、现代化的时代, 信息的获取和处理在我们的生活与生产中已经发展成为了一种重要的产业。据统计, 人类从外部环境中直接获取的信息大约可以占到所有获取信息的一半以上。但是这个庞大的数字在数字的传输与处理中给数据存储过程增加了处理负担。在我们的日常生活中, 我们可能仅仅需要图像所传递的基本信息, 但是, 在对图像进行一些加工和处理后, 我们能够在以前的基础上获取更多的相关信息, 这就是我们所说的视频图像, 也称之为运动中的视觉信息。

1 数字视频的内容与实际应用

1.1 数字视频处理的层次

数字视频视觉处理可以根据处理前后的输入、输出的信息划分为3个层次:1) 低级层次:在处理的过程中, 处理后的输出结果和处理前的输入信息都显示为图像, 不包含其他的特征信息;2) 中级层次:在这个层次中, 处理之前输入的信息内容为图像, 但是在经过处理之后, 输出的结果显示为特征性的信息, 而不是抽象意义的图片;3) 高级层次:这个层次的视觉处理就像是人类的视觉认知能力一样, 具备一定的人中与感知的能力。低级的数字视频视觉处理是为了通过这一过程, 达到改善图像的质量的目的。中级层次的主要目的是将低级层次的图像描述的内容进行系统性的分类, 然后做出相应的分析, 最后直接提取有兴趣的信息。高级层次的视觉处理是将提取后的信息做进一步深入的处理和归类, 促进与人类视觉相似的逻辑推理的有效完成, 得出一种信息符号, 作为其标志。

1.2 数字视频处理研究的领域

在数字视频视觉的处理与控制系统的基础之上, 数字视频处理系统可以应用到以下几个领域:1) 机器制造领域, 主要用于工业产品的检测, 产品包装的印刷、产品终极损伤度的检测等;2) 视觉上的导航, 包括日常生活中的驾驶GPS导航、自主导航和智能交通导航等领域;3) 安全防卫监控领域, 这一技术广泛运用于电子警察、远程行为监控和区域性的防盗等区域。鉴于我国的制造业的迅猛发展, 视频视觉处理和控制系统已经普遍性的应用于工业的生产、发展之中, 我们预言, 在未来不久的日子里, 我国也势必走向全球市场, 成为一个与世界媲美的生产场地。

2 数字视频视觉采集与处理系统的实现

数字视频的采集与处理系统大致由三个主要的模块构成:成像模块, 在这一模块中, 主要包括图像传感器和镜头这两个部分, 不用类型的图像传感器具备不一样的分辨率、感光面积和动态的范围等。这些技术已经广泛的应用与我们日常生活中常见的数码相机、摄像机、手机等一系列的电子产品中。在处理控制模块中, 我们最常见的成分有:PC机、通用的DSP和常用的ASIC等部件构成。在PC机主要是由不同类型的板卡和人机相互应用的一种软件类型, 生活中也常见此技术得以应用, 比如在高速公路上的收费站选用的收费系统, 我们身边的医疗成像系统。通用的DSP和ASIC的工作效率很高, 体积相对较小, 便于携带, 基于以上优点, 我们生活中广泛应用的是在对实时性要求比较高的一些特殊的场合:工厂里面的生产流水线上的监控、无人驾驶车上的监控装置。传输与显示模块会将获取的信息加工、处理, 最后发送到中端处理器上, 再进行深度的存储和加工。这种系统针对于视频图像而言, 数据处理的数量相对较大, 对实时性的要求也很高, 当然在传据的传输率要求也是非常的严谨。

3 数字视频处理技术

3.1 数字视频处理器具

3.1.1 多媒体计算机

对于计算机的硬件配置相求较高的计算机主机, 在数字视频处理的过程中的要求是相对较高的。比如说如果选用的CPU是双核配置, 就可以选择AMD和INTEL这两种类型, 最好的选择是后者或者酷睿系列的配置。对于主频而言, 越高的配置当然是越好的。为提高整体的速度和处理的能力, 最好选用内存在DDR21G以上大小的, 硬盘的平均存取时间一般要低于15ms, 然而这样速度的前提是选用SCSI系列的硬盘, 这样能更好的保证系统的稳定性。

3.1.2 视频采集卡

视频采集卡的主要用途是获取数码视频信息, 并在获取信息之后将其有效的存储和播放, 视频素材的选择非常重要, 一般选取模拟信号, 并结合视频采集卡来完成整个视频的处理。部分特殊的视频采集卡还会配备有更多的功能, 比如说压缩功能, 而且数据处理的速度较快, 更为重要的是, 它还可以全屏幕的数字视频捕捉。

3.1.3 主流显卡与压缩卡

在日前的市场上推出的主流显卡和压缩卡的类型比较多, ATI4870和GTX280等都是性价比相对较高的两款。但是在压缩卡的选择上, 要着重考虑压缩之后的文件的各种性质, 比如说文件的质量状况、稳定性能、价格及其功能的综合情况。当然, 显卡和压缩卡的匹配度对于数据视频的处理而言是相当重要的。

3.2 数字图像捕获和测量技术

3.2.1 桌面视频捕获过程

数字视频的捕获与压缩是一个非常复杂的过程, 一般称为桌面视频的捕获, 它是通过视频卡从视频源基地获得模拟性的视频信号, 并借助一系列的工具将其接收的视频信号有效转化为数字视频类的信号, 一般包括视频的采集和视频的压缩两个过程。

经过采集压缩之后的视频媒体文件需要在一系列的处理之后完成编辑的工作, 这个过程中就包括:剪切、编辑、切换以及特效功能的搭配, 因此借助计算机的编辑技术可以解决这个问题。在数字图像捕获和测量的过程中不仅要注重过程的严谨, 更要注意测量方法的合理搭配。只有通过科学的、合理的测量方法, 才能获取多样化的视频信息, 并逐渐展开, 提高数字视频视觉的采集和系统处理的过程。

3.2.2 像素当量测量法

每个像素都代表有实际的长度, 在没有标定数据的图像像素所代表的实际长度是不一样的, 一旦经过了标定, 每个像素所代表的实际长度就会成为一个常函数。在我们的后续工作中, 先将给定的图像进行校正, 然后求得各个特征点的像素, 和像素当量相乘的结果就是我们要求取的各个特征点之间的实际的距离。

像素当量测量方法的具体过程如下:1) 针对图像进行中值滤波, 在原始的灰度差别较大的图像基础上, 保持一个相对稳定的状态, 这样就避免了复杂的预处理全过程, 可以有效的去除存在于图像中的多种噪声;2) 分割水平方向和竖直方向的阈值。根据水平方向和竖直方向的标尺灰度的差值, 进行有效的修改, 得到一个最优值, 最后, 将标尺边缘的部分去除, 就能得到有效的部分。

3.2.3 边缘检测技术

图像边缘产生的原因是灰度值不连续而导致的结果, 在图像显示中, 指那一部分灰度变化特别显著的部分。在图像中, 往往会因为景物的物理特性的变化而产生图像边缘, 物理特性主要包括以下几个方面:阴影部分、物体的方向和深度以及反射的系数。

实际中图像是一个复杂的整体, 这就导致了边缘类型的多样化。我们可以根据灰度的变化情况, 将边缘划分为阶跃型和屋脊型的边缘。通过灰度的导数, 我们可以在实际的数学运算中刻画出边缘点的具体的变化过程。对于阶梯型边缘, 它的灰色变化曲线越大, 它所对应的导数值就会到达一个极限值。

目前主要通过两方面的改进来提高图像测量系统的精准度:第一, 硬件设备的改进;第二, 有效的利用空间目标的成像特征, 利用亚像素定位技术来测量定位的精准度。

4 结论

数字视频视觉的采集与处理技术在安防监控的相关产业、工业检测与包装印刷等领域里以及图像、内容的处理与控制系统中得到了广泛的应用与发展。它的最大优势在于处理和传输、存储的途径快捷, 通过数字视频技术对视频材料进行有效的编辑与整理, 是多媒体综合课件中一个必不可少的环节。因此, 本文对此研究热点进行了探析, 希望可以为人类社会的开发和发展提供一定帮助。

摘要:伴随着我国电子科学技术和计算机技术水平的飞速发展, 数字视频视觉的采集与处理技术得到了广泛的应用与发展。无论是安防监控的相关产业, 还是工业检测、包装印刷等不同领域, 在图像、内容的处理与控制系统中, 数字图像和数字视频都占据了不可替代的位置。它的最大优势在于处理和传输、存储的途径快捷, 通过数字视频技术对视频材料进行有效的编辑与整理, 是多媒体综合课件中一个必不可少的环节。因此, 本文将针对这一研究热点展开深入的讨论, 使之更好的服务于人类社会的开发与发展。

关键词:数字图像,数字视频采集,自动化处理系统

参考文献

[1]冈萨雷斯.数字图像处理.北京:电子工业出版社, 2004.

[2]李玉山, 来新泉, 等.电子系统集成设计技术.北京:电子工业出版社, 2007.

[3]刘文开.数码影像处理实用技术[M].沈阳:辽宁科学技术出版社, 2000.

视觉污染还是视觉福利? 篇2

所谓视觉污染,首先是污染的来源,其次,是污染的传播渠道,最终,则是污染导致的恶化效果。

视觉的污染源,说来诡异,大多是女人!这个网络时代,总是有不同的女人交替用“审丑”来吸引人们的眼球,从木子美的半是文采半是情色,让博客成为网民必备,到芙蓉姐姐和凤姐的一半奇特言论一半神奇造型,让转贴成为风尚。

到了干露露的登场,有人开始感叹,车展不知何时变肉展。从2011年干露露妈妈亲自给女儿拍裸体视频征婚的“浴室征婚门”开始,母女俩不断在各种媒体各种平台曝光,更大尺度,更让人匪夷所思的“半色情行为”,不断在各网站新闻频道、论坛、微博上出现。

很显然,网络传播,是当下的视觉污染的主要传播渠道。不断有网友说这对母女恶心,却不断有人转发和围观!只要你在公共平台,就总会突然有这对母女跃入你的视线!因为,还是有人以嘲笑、批判、看热闹等等不同的理由在传播!

女人愿意展露裸体,对于大多数男人来说,都算福利。然而,男人心底想看的,终究是个女人,甚至是羞涩的女人。而干露露母女的裸露,让人在心情上有种不爽快的感觉,肉体本身在此刻于心灵层面附加了太多的“欲望。”

好色是男人的本能,势力眼其实是许多女人的天经地义,只不过,大家因为都要装作“正常人”的样子,多少要有一点伪装。男女想上床,至少要有个谈情说爱的借口。女人想拍裸照赚钱,至少也需要个“为艺术献身”的借口。名气其实就像是一道菜。有的菜香气扑鼻,有的菜臭名远扬,博出位的方式,也越来越没有底线。而干露露母女齐上阵,“脱衣求高富帅女婿”的劲头,其实,暗暗戳伤了许多人的心理底线!

即使是最好色的男人,只要稍微有点道德感,都会觉得这对母女是视觉污染,她们露的不止是裸体,而是一种道德沦丧的坦然,观看者没有了“被满足”的喜悦,反而有了种被利用的龌龊感。

基于电影视觉风格的镜头处理技巧 篇3

关键词:电影视觉风格,镜头处理技巧,镜头语言

在电影行业飞速发展的过程中,影视制作技术与观众欣赏能力的提升,迫使电影作品的制作和处理技术急需提高和完善,而电影的整个制作过程恰好是由一个个镜头所组成的,作为其中最基本的单位,对其使用不同的处理方法,会给观众呈现出不一样的视觉体验和感受,在漫长的电影发展历程当中,对于镜头的处理技术已经衍生出众多种类,为了将电影视觉风格最好的一面呈现出来,加强对以提升电影视觉风格为目的的镜头处理技巧的研究与分析十分必要,具有一定的现实意义。

一、关于对镜头语言的诠释

近些年来,镜头语言的概念逐渐在电影行业内流行起来,尤其在镜头本身已经成为电影中不可或缺的一种视觉元素的基础上,镜头语言的有效利用,无疑会让电影在视觉风格的呈现上锦上添花。事实上,所谓镜头语言,是由电影制作者运用镜头的组接技术将一个个电影画面连接起来,进而表述出一种情感或思想观念,从电影专业的角度来说,便称之为镜头语言。经过长期的发展历程,当前的镜头语言可以被主要划分为固定与运动镜头两个主要的类别,电影制作者要结合电影的实际需要,从服装、道具、场景等不同方面对电影镜头进行科学合理的设计,以便带给观众良好的连贯性和视觉效果,这些均需要进行不同阶段时期的连接、组合与处理,以保证镜头的完整性,当然诸如运动镜头包含了摇镜头、拉镜头、推镜头等具体不同的镜头处理技巧,需要依据不同的电影制作情况而定,如此才能体现出不同类型电影的不同视觉风格。

二、基于电影视觉风格的不同类型的镜头处理技巧研究

(一)针对镜头连接方式的处理技巧

电影的制作离不开镜头连接方式的处理,其中叠化作为最常见的镜头连接方式,对于电影视觉效果的增强具有不可忽略的作用。通常情况下,制作者通过对一组镜头进行连续不断的叠化处理,可以在电影视觉风格的营造方面产生很大的影响,无论是从观众的角度为其创设出的视觉冲击,还是从电影自身情节、内容上的情绪渲染、视觉范围营造,都十分有利于后期电影上映的体验与效果的提升。同时,在镜头叠化速度与时间的长短方面的处理,也可以分别达到既定的视觉风格。

(二)电影镜头“定格”的处理技巧

在电影领域,所谓定格处理主要围绕丰富电影的视觉冲击效果和风格画面而实施,其中,瞬间静止的镜头画面给观众带来的视觉体验无与伦比,令人惊叹,通过在运动镜头的表现中采取突然静止的手段,以出其不意的悬念和视觉感受获得观众的欣赏。当然除此之外,很多电影在制作过程中会遇到后期剪辑的阻力,以定格方式的处理技巧可以有效弥补这方面的不足,所以运用此种镜头处理技巧无疑给电影画面和内容的显现均提供了很好的帮助。

(三)电影中大全景镜头的处理技巧

很多电影在拍摄制作的过程中需要大量的外景,而大全景镜头正是为表现电影的大场面视觉效果而形成的。尤其在很多充满特效的好莱坞大片中,这种镜头处理技术常常被运用,比如:表现某位英雄人物的威猛形象时,必定会营造出令观众极为震撼的大场面视觉风格,而在运用该方式的过程中,同时要兼顾电影中局部的一些细节展示问题,比如《斯巴达300勇士》这样的视觉特效好莱坞大片,注意这项环节,必将形成较为鲜明的对比,更加突出人物的思想和个性,而不止于仅仅为创设大场面视觉风格而使用,因此,在电影镜头的处理技巧当中,这也是不可忽略的重要手段之一。

三、结语

视觉处理 篇4

机器视觉是通过计算机处理图像,提取所需信息的一门技术,完整的工作系统能够自动获取图片或视频信息,进行增强、分辨、测量、判断并输出结果。机器视觉技术的飞速发展为各行业的自动化发展提供了技术支持。机器视觉作为计算机辅助或替代人类视觉工作的技术,具有较大的潜力与开发难度[1]。充分合理的利用视觉导航技术不仅可以实现智能化,还可以实现人工无法完成的工作,解决实际生活中的不安全问题,在工业生产中可以代替人工,提高生产效率等。目前,视觉导航技术在机器人、无人机、全自动驾驶、农业机械等领域得到了较为广泛的应用。行人检测、汽车制动性能检测、车辆检测、测量车距与车速、检测车道线、检测交通标志等都已取得了比较成功的进展。经过业内学者不断地创新研究,目前出现了基于单目、双目和多目的视觉系统,以及与之相结合的对目标物体的颜色、形状、边缘、纹理等多种特征的跟踪方法。

1 图像采集及处理系统基本组成模块

在视觉导航系统中,图像的采集和处理是最为核心的步骤。通常由图像采集系统和图像处理系统为后续的编程、路径规划等导航工作提供有关的准确数据信息。如图1所示:

图像采集系统将获取的图像信息转换为数字信号,将数字信号分别传输到图像处理系统和计算机;图像处理系统通过专用的硬件对数字图像进行处理并获得程序要求的如颜色、边缘、纹理等参数信息,将信息传送到计算机来计算[2]。

2 国内外近年研究现状

在视觉导航系统中,以摄像机为主的视觉传感器提供了最原始的视觉图像。为了快速并且准确的检测以及跟踪目标,对图像的处理和特征信息的采集是视觉导航系统中最基础也是最关键的步骤。

2.1 视觉图像采集及特征提取技术

图像获取及特征信息的采集是图像处理的前提。以CCD技术为核心,目前图像获取设备有黑白摄像机、彩色摄像机、扫描仪、数字相机等,性能与价格主要取决于CCD的规格,如尺寸等。除了这些常见的类型外,目前有许多厂商提供各种其它的专用设备,如显微摄像设备、红外摄像机、高速摄像机、胶片扫描器等等。遥感卫星、激光雷达等设备提供其它类型的数字图像。CMOS(Complementary Metal Oxide Semiconductor)即“互补金属氧化物半导体”图像传感器的出现,使成像成本更低,而且易于大规模生产[3]。

2010年,许海霞[4]提出分层MS匹配搜索的思想,给出分层的MS匹配迭代跟踪算法。2013年,张雪华等人[5]采用Kinect摄像机获取RGB和深度图像,并改进了增量直方图算法。它的基本思想是根据增量式相似度计算来确定每个粒子的权值。在粒子滤波器中用粒子代替目标的一种可能性状态,并且粒子滤波算法不需要满足线性、高斯系统,应用更加广泛。2014年,肖晖等人[6]引用了基于CCD相机获取待检砝码图像,Matlab中Roberts算子[7]对待检砝码的边缘检测。该算子检测边缘的精度比较高,但边界有点粗,需后续的处理。Aurélio Campilho等人[8]提出了一种SSACA+EP算法,该算法整合了约束传播机制纳入其框架,不能链接制约整个相似矩阵,使得这一过程更有效率。但是由于帧的数量二次,使得该算法具有复杂性,他们计划扩展这种算法到其他时间聚类算法。2015年,贾宝芝[9]提出了一种基于两连续帧运动信息提取的TCF(Two Consecutive Frames)模型,在不需要进行摄像机标定的情况下,利用运动信息获取障碍物的相对高度,从而区分障碍物与阴影和标志线。该方法能够将障碍物与道路阴影以及道路标志线区分开,同时要满足实时性的要求,而且不需要对摄像机进行人工标定以及其他先验知识。

2.2 图像处理技术

恶劣的天气和光照不均匀都会降低视觉图像的质量;复杂环境中如何提取静止或运动目标,确定目标数量,提取关键目标;在跟踪过程中,目标出现遮挡、或相似目标干扰时,会导致发散甚至跟踪丢失的问题。因此,视觉图像的去噪、滤波、增强技术十分关键,对后续目标识别跟踪的准确性、实时性产生较大的影响。

2000年,Adisorn Tuantranont等人[10]指出高斯(Gauss)滤波,就是为了得到较好的图像边缘、信噪比(SNR)较高的图像而设计的一种很好的滤波方式。2005年,孙海涛[11]提出了一种CB数学形态学滤波处理方法。2006年,叶敏[12]提出一种基于FPGA的实时图像模板滤波及边缘检测方法,将Lo G[13]模板分解为两个可分离模板的和,从而降低了算法运算量。并充分利用FPGA的并行机制及片内丰富的RAM资源,采用分布式算法[14],用查找表代替乘法器进行乘法运算。2013年,陈龙[15]提出了一种新的基于联合双边滤波方法的恶劣天气下的图像增强算法。提取图像的暗通道或亮通道,通过灰度膨胀腐蚀运算来估计环境光,然后通过快速的双边滤波技术[16]完成大气幕和光照分量的相对精确估计。2015年,岳洪伟[17]对传统的Canny边缘检测算法[18]中高斯卷积和双阈值设置这两个步骤进行了算法的改进,提出三段式匹配预处理算法。

3 视觉导航技术未来发展趋势

目前,随着各类导航技术的不断完善和多种图像获取、信号处理技术的快速发展,视觉导航技术得到了更为广泛的应用。在部分领域视觉导航技术已经趋向成熟。但是由于工作环境变的越来越复杂,对视觉导航技术的鲁棒性要求提高,在某些方面仍有很多关键问题需要解决。如以下几个方面:

3.1 图像获取技术

视觉图像的获取是视觉导航技术最基本的要求,不同的图像获取方法得到的视觉图像质量也有所差异。目前,有单目视觉、双目立体视觉、多目立体视觉的视觉传感器形式。单目视觉是利用单个摄像头对环境进行识别的方法。通常单目视觉传感器只能够识别二维的环境信息而无法获得环境的深度信息,计算速度快,但定位的准确性有待提高。双目立体视觉的工作原理是对人类双眼的仿生———通过两个摄像机分别获得场景的左、右图像,然后通过三角测距的原理得到环境的深度信息。双目立体视觉获取的信息更加丰富,并且在对远距离、小型障碍物的识别方面更有优势。但是,双目立体视觉系统存在的问题在于左右立体图像对的匹配工作比较困难,而且容易受到光照的影响,在夜间的工作性能也大大下降。多目立体视觉同样是利用了人双眼成像的原理来进行环境的立体识别。但是,与双目不同的是,多目立体视觉采用了三个或三个以上的摄像头作为环境识别传感器。采用多目立体视觉可以获得更大的视野范围,更高的识别精度,但是由于传感器数目的增多而导致的数据处理量急剧增加,从而造成处理时间的增加,使其很难满足系统的实时性要求。因此,图像获取技术的一个发展趋势是找到一个同时满足对目标检测的实时性和准确性的图像获取方法。

3.2 图像增强技术

为了增强对图像分析和识别的能力,还需要突出有用信息,剔除图像中其他景物内容的干扰,采取图像增强技术。图像增强的应用主要有两类:一是,改善图像的视觉效果;二是,突出图像的特征,便于计算机处理。现有的图像增强技术大致可以分为三类:空间域法、变换域法和模糊处理法。空间域法直接对图像像素点的灰度值进行操作。针对不同的应用要求,采取灰度值变换或空间滤波等方法。变换域方法首先将图像映射到某个变换域,然后在该变换域对图像进行处理以突出图像的某些特征。采用直方图均衡化变换的方式对图像增强处理,可以突出原图像的细节,对边缘检测有很好的效果。但是在恶劣的环境中,噪声对图像影响较大,从而影响图像增强效果。其中一个发展趋势是针对不同的图像采取图像滤波、去噪处理与图像增强技术相结合,进而取得更好的图像增强效果。

3.3 图像特征提取技术

获取得到的目标图像数据量巨大且含有很多与识别无关的信息,若直接利用图像原始数据进行分类则计算量很大且不现实,必须对图像进行特征的提取和选择,特征提取若不恰当就会影响视觉导航的准确性。目前有基于颜色、边界、纹理、表达、学习、模型以及其他特征的提取方法。一个好的特征一般具有可区别性、可靠性、独立性、数量少等特点。单一的特征提取方法往往无法满足目标跟踪准确性的要求,多特征提取方法提高了准确性同时增加了计算复杂度。因此,再引入多特征的同时研究一种算法来提高计算速度是未来的一个发展方向。

4 结束语

本文主要介绍了视觉导航系统近年来国内外的发展现状,对图像处理及特征提取技术做了简单总结并提出未来的发展趋势。

视觉处理 篇5

1 系统的组成

图像识别系统主要组成部分,如图1所示。

进行图像预处理的目的是为了去除干扰、噪声和差异,将原始彩色图像变成适合于计算机进行特征提取的形式,为特征提取做好必要的准备。图像预处理的质量直接影响到整个系统的识别准确率[1]。

2 图像的预处理

2.1 原始图像预处理流程图

在图像预处理过程中,主要步骤,如图2所示。

文中主要以破损胶囊的图像为例进行了预处理。包括灰度变换、滤波、边缘增强、阈值分割、边缘提取、缺陷识别等几个步骤。

2.2 图像预处理

灰度变换是所有图像增强技术中的基本手段之一,主要有以下几种:图像求反、线性灰度变换、对数变换、灰度切割等。其实质就是按照一定的修改规则,改变图像的每一个像素灰度。使图像的动态范围增大,扩大对比度,以使获得的图像更加清晰。

在滤波部分,由于设计本身以及设备等外界因素的干扰,在胶囊缺陷图像采集的过程中难免会引入一些噪声,使图像的质量受到影响。为减少这样的影响,需要对图像进行滤波处理。常用的滤波方法,主要有:均值滤波、逆滤波、维纳滤波、中值滤波等。

边缘增强就是为了将物体的边缘和轮廓凸显出来,方便提取物体的特征而对物体进行识别和分析。边缘是一个区域的结束,也是一个区域的开始。在图像中,边缘和轮廓的灰度一般会突变。图像的边缘有方向和幅度两个属性,沿边缘方向像素变化平缓,垂直于边缘方向像素代表实际边缘。边缘上的这种变化可以用微分算子检测出来,常用算法有:梯度、高斯-拉普拉斯、Canny算子等算法[2]。

图像分割是将图像细分为它的子区域或对象。图像分割算法一般基于亮度值的两个基本特征:不连续性和相似性。第一类方法基于亮度的不连续变化分割图像,比如图像的边缘。第二类方法依据事先制定的准则将图像分割为相似的区域。比如门限处理、区域增长、区域分离、聚合等[3]。文中主要指将图像中灰度与其周围明显不同的区域提取出来[4]。

在边缘提取中,集合A的边界表示为β(A),B是一个适当的结构元素。它可以通过先由BA的腐蚀,然后再用A减去腐蚀得到。即

β(A)=A-(AΘB) (1)

从而提取到边缘信息。

在得到感兴趣的目标以后,为对胶囊的缺损进行分类,需要进行特征提取,然后对提取的数据进行分析和设计。文中主要以破损胶囊目标区域的形状进行了初步分析。实际基于几何形状基本可以识别出简单的胶囊缺陷,但胶囊缺陷有多种。有些仅靠几何形状难以做出判断,因此还需要寻求其他方法。

3 文中选用方法

3.1 滤波

由于设备自身原因及外界干扰因素的存在,在胶囊缺陷图像采集过程中难免会引入噪声。为减少噪声对图像的影响,应对图像进行滤波。

3.1.1 几种滤波方法介绍

(1)均值滤波。

是一种常用的线性低通滤波。均值滤波器的滤波过程是使一个模板在图像上滑动,模板中心位置的值等于模板内各像素点灰度的平均值。它的数学表达式为

g(r,s)=1Μ(x,y)Af(x,y)(r,s)=0,1,2,,Ν-1(2)

(2)逆滤波。

是研究退化图像最简单的方法。其表达式为

F^(u,v)=F(u.v)+Ν(u,v)Η(u,v)(3)

其中,F^(u,v)为复原图像的傅里叶变换;F(u,v)为原始图像;N(u,v)为一个随机函数;H(u,v)为滤波函数,其过程如图4所示。

逆滤波器的问题是会出现病态性,即在频域中对应图像信号的那些频率上,若H(u,v)=0或微小,而噪声频谱N(u,v)≠0,则N(u,v)H-1(u,v)就难以计算或者比F(u,v)大得多,从而使复原结果与期望结果相差较大,甚至面目全非。

(3)维纳滤波。

是寻找一个滤波器,使得复原后的图像与原始图像的均方差最小。因此维纳滤波也叫作最小均方误差滤波。其综合了退化函数和噪声统计特性两个方面进行复原处理。可以自动抑制噪声,信噪比高。但维纳滤波也存在一些问题。因为维纳滤波是建立在最小化统计准则基础上的。所以其得到的结果也只是平均意义上的最优,而且其花费的时间也较多。

(4)中值滤波。

是一种非线性的平滑滤波器。它在消除噪声的同时,能较好地保持图像细节,防止图像边缘变得模糊。在一定条件下,对滤波脉冲干扰及图像扫描噪声最为有效。定义如下:设{xij(i,j)∈I2}表示数字图像各点的灰度值,滤波窗口为A,yij为窗Axij点的中值,则

yij=ΜedA{xij}=Μed{x(i+r)(j+s),(r,s)∈A,i,j∈I2} (4)

3.1.2 文中滤波方法

因选用数字摄像机拍摄图像,数字摄像机的噪声呈孤立的点状,容易恶化图像的质量,使图像模糊,将图像自身的特征掩盖,因此就需要一种高效的滤波方法[5]。基于这些特征,文中选用自适应中值滤波方法。

自适应中值滤波是一种非线性的去噪方法。其原理是把数字图像或数字序列中任一点的值,用该点领域中各个点值的中间值代替。用一个窗口在图像上扫描,把窗口内包含的图像像素按灰度级升(或降)序排列起来,取灰度值居中的像素灰度为窗口中心像素的灰度,完成自适应中值滤波。

二维中值滤波可以取线性、方形、十字形或菱形;常用维数有3×3,5×5,7×7等。

经自适应中值滤波后,所得结果如图6所示。

3.2 分割

在图像中,分割是为将图像划分为不同的区域。基于灰度阈值的分割方法是图像分割的经典方法[6]。在图像目标区域和背景区域内部灰度的相关性较强,可以使用灰度的均一性作为分割的依据。而如何选择一个最佳的分割阈值则是图像分割的关键。根据图像的特点及其条件,最佳阈值选取的方法有人工选择法和自动阈值法。

3.2.1 几种分割方法介绍

(1) 人工选择法。

是通过人眼的观察,应用人对图像的知识,在分析图像直方图的基础上,人工选用合适的阈值。也可以在人工选出阈值后,根据分割效果,不断地交互操作,从而选择出最佳阈值。但其缺点是必须有人介入,这样很不合理。

(2) 自动阈值法。

通常使用灰度直方图来分析图像中灰度值的分布,结合特定的应用领域知识来选择最合适的阈值。主要有3种选择:迭代式阈值选择、最小误差阈值选择法、Otsu法阈值选择。

迭代式阈值选择方法的基本思想是:开始时选择一个阈值作为初始估计值,然后按某种策略不断地改进这一估计值,直到满意给定的准则为止。

最小误差阈值选择法通常以图像中灰度为模式特征[3]。假设各模式的灰度是独立同分布的随机变量,并假设图像中待分割的模式服从一定的概率分布,则可以得到满足最小误差分类准则的分割阈值,但其缺点在于,难以获得待分割模式的概率分布。

Otsu法阈值选择是文中主要选用的阈值分割算法。

3.2.2 文中选用分割方法

文中由于光源的不均匀性会造成胶囊在各个位置图像的灰度值存在较大的差异。胶囊中间部分的亮度会稍大于两边的部分。而且也因为双峰法和自动取值法有着明显的缺点,且适应能力差,所以在文中选用最大类间方差法对图像进行阈值分割。

最大类间方差法是由Ostu基于最小二乘法推导而成,又称为大津法。具体实现方法如下:设一幅图像的灰度值可以分为0~m级,灰度值为i的像素数为ni,则总像素数位

Ν=i=0mni(5)

那么各灰度值出现的概率为Pi=ni/N,然后将灰度值分为两组:c0={0-k}和c1={k+1-m},则c0出现的概率为

ω0=i=0kΡi=ω(k)(6)

c1出现的概率为

ω1=i=k+1mΡi=1-ω(k)(7)

由以上两式可以推出c0平均值为

u0=i=0kiΡi/ω0=u(k)ω(k)(8)

c1的平均值为

u1=i=k+1miΡi/ω1=u-u(k)1-ω(k)(9)

其中,uk=i=0kiΡi是阈值为k时的灰度平均值;u=i=0miΡi是整体图像的灰度平均值。这样两极之间的方差就可以表示为

σ2(k)=ω0(u-u0)2+ω1(u1-u)2 (10)

从0~m之间改变k值,计算上式求其最大值便是所求的阈值。选用最大类间方差法对图像进行了阈值分割后,其处理结果如图7所示。

4 实验

系统采用大恒图像采集系统,用1 024×1 024相机完成对胶囊原始图像采集,然后应用LabVIEW软件实现上述图像处理算法。实验素材来源于胶囊制造企业,并且人为加入外壳破损、大小丸和异形丸等问题胶囊,参加测试胶囊共计100颗。实验以10颗一组分为10组,随机反复实验,验证本胶囊外壳缺陷检测系统的可靠性和稳定性。部分实验数据如表1和表2所示。

如表1 所示为对同一组实验胶囊进行反复识别实验,从随即抽取的5组数据中可以看出系统具有较高的可靠性。如表2所示,对所有样品进行实验,并与工人筛选结果进行比较,识别正确率高于90%,具有一定的实际应用价值。

5 结束语

提出了一种完整的胶囊识别图像增强预处理算法及实现,包括灰度化处理、中值滤波、对比度调整、边缘增强等。采用多种识别方法对胶囊的多种缺陷进行分类识别。并通过搭建实验平台予以验证,结果表明,预处理的功能模块能够有效抑制采集过程中引入的噪声,增强图像质量,突出缺陷特征信息,达到了较高的识别精度。

参考文献

[1]王吴雨.图像处理技术在玻璃缺陷检测中的应用[J].工业控制计算机,2011,24(2):37-40.

[2]姚敏.数字图像处理[M].北京:机械工业出版社,2006.

[3]阮秋琦.数字图像处理[M].2版.北京:电子工业出版社,2007.

[4]侯艳丽,杨国胜,黄春艳.基于字符识别的门牌号识别算法研究[J].河南大学学报:自然版,2004,34(1):76-79.

[5]王飞,崔凤奎,刘建亭,等.一种平板玻璃缺陷在线检测系统的研究[J].应用光学,2010,32(3):72-76.

视觉处理 篇6

众所周知,焊工可以通过眼睛或者工业电视观察焊接熔池来对工件或焊枪进行调整并能达到很高的精度。但是这依赖于焊工个人的经验、带有主观性、劳动强度大、并受烟尘和弧光的影响,也会产生偏差。因此很有必要实现焊缝偏差的自动控制。焊接自动化、智能化是现代焊接技术发展的主要方向。

焊接机器人是在工业机器人的基础上发展起来的先进焊接设备,国际上越来越广泛的采用焊接机器人系统代替人工焊接。焊接机器人生产的柔性、焊接工艺的优越性,对劳动强度和工作进程的改善,对产品质量的提高,以及缩短工作时间,提高工作效率和降低成本,逐渐为人们所认识和接受。在焊接生产领域中,应用焊接机器人已成为一个国家焊接技术和焊接自动化水平的重要标志[1]。

国内城市轨道车辆、高速列车的迅猛发展使得城轨门生产逐年猛增,品种不断翻新,但铝镁硅合金框架等主要零部件仍为手工焊接。由于手工焊接依赖于工人的技术水平,效率低,焊接质量欠佳,优质品率低,是制约我国城轨门产品升级的关键技术。然而城轨门铝镁硅合金框架弧焊机器人工作站在国内城市轨道及高速列车城轨门行业中的应用尚未见报导。铝镁硅合金框架弧焊机器人工作站的建立和完成使城轨门制造的技术达到国内领先水平[2]。

机器人焊接需要事先对轨迹进行规划,但是城轨门框架零部件在加工和夹具装夹[2]时会产生尺寸误差,这使得机器人按照预先规划好的轨迹进行焊接的结果可能产生偏差,且由于变位机工作台的面积大,其挠度变形不容忽略,为保障合金框架焊缝焊接质量,采用计算机视觉焊缝跟踪技术为解决这一问题提供了一种新的方法[3,4,5]。

1 图像采集方案的确定

城轨门框架的焊缝是由多组间断的短焊缝组成的,尺寸偏差较大的情况只产生在一组焊缝与另一组焊缝之间,而每组焊缝之间的尺寸误差很小。在上述条件下,只需在焊接每组焊缝之前进行焊缝跟踪,并通过反馈控制系统纠正偏差就可以达到城轨门的焊接要求,而不需要在焊接过程中不间断的跟踪。

采用间歇方式焊缝跟踪,图像采集系统可以在焊接每组焊缝前采集一次图像,这样可以避免弧光干扰。同时,为了获取稳定的焊缝图像,必须安装外部辅助光源。

2 影响焊缝图像采集因素的分析

焊缝的视觉跟踪是在采集的焊缝图像基础上进行一定处理运算得到焊缝中心并跟踪的,在非焊接时采集的未焊接焊缝图像中没有明亮的熔池作为焊缝位置的标志,只依靠焊缝与周围区域的明暗确定焊缝,明暗对比度的显著性和稳定性对焊缝提取有着重要作用,综合利用各种因素提高上述性能是提高焊缝视觉跟踪可靠性和抗干扰能力的必要措施。

在焊缝上没有明亮光源的情况下,外部光源是影响图像质量的首要因素。例如,较强的逆光会使图像产生大面积的黑暗区域而无法确定焊缝的位置;而局部的强光又可能使计算机错误地判断其它位置为焊缝等。因此焊缝位置要避免阳光和强烈灯光的直接照射,并采用柔和的灯光以一定角度均匀地照射拟采集图像的区域,以获取明暗度稳定的图像。

摄像头的位置和角度也会对焊缝图像产生重大影响。摄像头与焊缝距离过近会使图像中焊缝与周围区域的明暗对比度差别减小而影响焊缝提取,如图1所示;而适当的距离会增加明暗对比度,如图2所示。当摄像头在焊缝左侧位置倾斜安装时,焊缝在图像中的位置会受到焊枪与工件之间距离误差的影响,如图3所示。另外,摄像头的倾斜还会使采集图像各区域的明暗不一致和图像扭曲变形,因而影响焊缝的提取效果。

摄像头和图像采集卡的分辨率如果过低,会使采集到的图像清晰度下降,这将降低焊缝中心的定位精度,并进一步影响焊缝跟踪的精度。

综上所述,针对这种间断焊缝的视觉跟踪,本文采用了柔和的具有均匀照度的光源作为辅助照明光源,并避免其它强光对焊缝的照射干扰;同时,采用适当分辨率的摄像头和视频采集卡,摄像头以一定距离正对焊缝周围区域的表面采集图像。

3 焊缝图像处理

CCD获取焊缝图像,经图像采集卡A/D转换后送入计算机内存,然后采用各种图像处理方法对图像数据进行处理。图4(a)是使摄像头正对焊接工件表面现场采集到的氩气、二氧化氮混合气体保护焊V型焊缝图像,焊缝在图中为纵向。图像处理要求处理时间短,并能准确提取出焊缝激光条纹信息,从而准确检测焊缝位置,实现焊缝实时自动跟踪。针对上述特点,对原始采集到的图像采用了中值滤波、阈值变换、图像反色、拉普拉斯锐化、细化一系列处理,能够很好地滤除刀痕反光、阴影,以及周围环境电磁、静电等产生的噪声干扰,准确提取出焊缝条纹信息,并且图像处理时间短,满足焊缝实时跟踪要求。

3.1 中值滤波

中值滤波是一种非线性平滑滤波器,它将使一个模版覆盖区域内所有值中排在中间的一个赋给模版中心位置的像素。它在既要消除噪声又要保持图像的细节时使用,其主要功能是让与周围像素灰度值的差比较大的像素改取与周围像素值接近的值,从而可以消除孤立的噪声点[6]。图4(b)是中值滤波后的图像,有效地滤除了由刀痕造成的反光和阴影等噪声信号。

3.2 阈值变换

灰度的阈值变换是将一副灰度图像转换成黑白二值图像,灰度阈值变换的变换函数表达式为[6]

式中,T为指定的阈值。

阈值变换的意义是如果图像中某像素的灰度值小于该阈值,则将该像素的灰度值设置为0,否则灰度值设置为1。针对在误差较小时的焊缝位于中部区域,且灰度值明显低于其周围区域的特点,分别从图像的两侧各取一条纵向直线,计算每条直线上所有像素灰度值的平均值(i=1,2)和方差σi(i=1,2),则阈值T为

采取式(2)中较小的T值作为指定的阈值进行阈值变换。图4(c)是经过阈值变换后的图像,有效地提取了焊缝的信息,并滤除大部分由刀痕产生的阴影。

3.3 膨胀变换

膨胀是将与物体边界接触的背景像素按照某种规则合并到物体中的过程[6]。记A用S结构单元膨胀为A⊕S,广义的膨胀定义为

本文中焊缝为贯通图像上下的值为0的像素,为了避免膨胀变换过程中对焊缝产生过多的影响,取S的结构为5行1列的向量[1 1 1 1 1]’,则本文中膨胀变换的意义为:以图像中值为1的像素为中心,分别把上面和下面2个相邻的像素值置为1。对于图4(d)为把图4(c)进行膨胀变换后的图像,有效的去除了由刀痕产生的阴影,更加突出了焊缝条纹。

3.4 细化变换

“细化”过程是求图像骨架的过程[6,7]。所谓图像的“骨架”,是指图像中央的骨骼部分[4]。集合A被结构元素B的细化用A⊗B表示,细化定义为[6]

{B}基于如下结构元素序列:

式中Bi是Bi-1的旋转。这就是用B1细化A,然后用B2细化前一步细化的结果,直到A被Bn细化,整个过程重复进行且到没有进一步的变化发生为止。图4(e)是经过细化后的图像,从中可以看到,图像的“骨骼”凸现出来了,准确提取了焊缝中心的位置信息。

在实验中还采用这种算法对没有V形坡口的焊缝按照上述流程进行处理,处理后的图像如图5所示。

上面的处理结果表明这种图像处理流程对于非坡口焊缝也适用。同时,这也说明该算法具有很强的适应性和抗干扰能力。

4 图像处理的程序实现

用于焊缝跟踪的图像处理必须解决两个关键问题,其一是如何消除噪声干扰从而准确提取焊缝信息;其二是尽量提高图像处理速度,满足焊缝实时跟踪的要求。这两个问题是相互矛盾的两个问题,因此如何简化图像处理方法,提高处理速度是焊缝跟踪的难点之一。

上述焊缝图像的处理算法是利用Visual C 6.0++编程实现的。程序流程如图6所示,用于运行程序的电脑为赛扬CPU,主频为2.4 G,内存为256 M,对大小为290×330像素的图像进行上述处理,所需时间为47ms,能够满足实时跟踪的要求。

5 结论

(1)基于焊缝跟踪的轨道车辆城轨门机器人焊接技术的应用使城轨门制造的技术达到国内领先水平。

(2)在多组间断焊接的情况下,城轨门机器人焊接可以采用每组焊接前进行焊缝跟踪的间歇式跟踪方式。

(3)在非焊接情况下进行焊缝跟踪要配以适当的辅助光源,并要避免周围环境的强光等噪声对跟踪过程的干扰。同时,要采用适当分辨率的摄像头和视频采集卡,且摄像头以一定距离正对焊缝周围区域的表面采集图像。

(4)对原始城轨门框焊缝图像采用了中值滤波、阈值变换、膨胀变换、细化变换一系列处理,该方法能够准确提取出焊缝中心位置信息,并且处理时间短,能够满足焊缝实时跟踪要求。

参考文献

[1]毛鹏军,黄石生,李阳等.焊接机器人技术发展的回顾与展望[J].焊接,2001,(8):6-10.

[2]刘极峰,闫华,毕光明.城轨门弧焊机器人工作站的研究[J].机电产品开发与创新,2004,17(5):15-17.

[3]BAE K Y,LEE T H,AHN K C.An optical sensing system for seam tracking and weld pool control in gas metal arc welding of steel pope[J].Journal of Materials Processing Technolgy, 2002,120(3):458-465.

[4]KUO H C,WU L J.An image tracking system for welded seams using fuzzy logic[J].Journal of Materials Processing Technology,2002,120(5):169-185.

[5]Chen Q,Zhang W,Du D,et al.A new straight line detection method in images for robot seam tracking[J].CHINA WELDING,2006,15(6):1-5.

[6]李程,彭天强,彭波,等.智能图像处理技术[M].北京:电子工业出版社,2003.

视觉处理 篇7

自动导航车AGV (AutomatedGuidedVehicle) 即自动导引车是一种无人操纵的自动化运输设备, 它能承载一定的重量在出发地和目的地之间自主行驶自动运行。根据美国物流协会的定义AGV是指装备有电磁或光学等自动导引装置能够沿着规定的导引路径行驶具有安全保护以及各种移载功能的运输小车。按日本JISD 6801的定义AGV是以电池为动力源的一种自动操纵行驶的工业车辆。

自动导航小车目前主要应用于柔性加工系统柔性装配系统、自动化立体仓库以及其他一些行业作为搬运设备。自动导向车 (AGV) 视觉导引控制是利用CCD采集路面上条带状路径标线的图像信息, 由计算机处理后识别出路径, 保证AGV沿着路径标线运行, 相比于传统的电磁导引方式, 视觉引导路径的设置和变更具有简单方便、成本低、易维护的优点。AGV是现代物流系统的关键设备, 它对于提高生产自动化程度和提高生产效率有着重要意义, 因此AGV已经得到了越来越广泛的应用, 对AGV的研究具有十分重要的理论意义和现实意义。

图像处理的质量是影响视觉引导AGV精度及实时性的关键因素, 一切识别的基础都要由图像处理开始。当摄像机采集到图像信息之后, 如果不经过处理很难得到计算机需要的信息, 那就更谈不上识别了。由于标线引导的特殊性 (颜色信息少, 图像比较单一等) 图像处理工作相对比较简单。本文使用的方法主要通过灰度化处理———二值化———提取边缘线———中心线拟合等, 最后计算出小车的距离和角度偏差信息。[1]

1视觉引导AGV引导原理简介

视觉导引AGV是利用CCD采集路面上条带状路径标线的图像信息, 交由计算机处理后识别出路径, 然后根据车辆与路径标线之间的相对位置偏差控制车辆的运行方向, 保证AGV沿着路径标线运行[2]。CCD采集的路径标线图像包含车辆在某一时刻相对于路径标线的位置信息, 即车辆的纵轴线与路径交角α以及与路径之间的偏移距离e, 如图1所示。但在所采集的图像中还可能存在着因为地面反光、摄像机抖动和标线污染等引起的噪声。所以必须对图像进行处理才能达到可靠引导的目的。

2 地面图像获取

本文设计的AGV, 摄像机是安装在小车头部, 垂直于路面, 如图2所示, 从而减少在图像采集过程中受到其他因素的干扰, 并且可以减缓镜头产生的几何畸变。

当摄像机采集到路面上的图像之后, 经过车载计算机上的采集卡采集转化为计算机可以识别的位图文件也就是BMP文件如图3所示。这种格式的文件能够显示色彩和色调变化丰富的图像, 逼真地还原出路面的真实景象, 同时也可以很容易地在不同软件之间交换文件。通常我们使用的位图文件的颜色有16色、256色、真彩色24位等, 在本文所使用的是真彩色24位色 (28×28×28) 的位图储存模式。

图4为自动导航小车通过CCD采集没有经过处理的图。

3 数字图像处理

摄像机采集到的图像经过以下处理, 才能为计算机所识别。

3.1 灰度变换

由于AGV的路径标示采取黑白对比的路标, 因此对路标图像的处理, 只进行边缘检测。本文检测的路标形状比较简单, 与背景有较明显的灰度差, 因而采用图像二值化方法[3]。本文采用最大方差阈值设定法来确定合理阈值。此方法是把图像灰度直方图在某一灰度值处分成两组, 当被分成的两组间方差最大时, 该灰度值就是阈值ε, 如图5所示。

在实验过程中根据实际场所拍摄的图片和仿真平台获取的图片来看, 该方法基本满足AGV的要求, 结果较好, 基本将引导线从背景中分割出来, 边缘处较规整。如图6、图7为阈值ε为108时拍摄图像的灰度化图像和的二值化图像:

3.2 噪声消除

消除图像噪声时, 中值滤波法可有效去除滤波性噪声, 对图像边缘具有良好的保护效果。因其有时会损失细节, 文章采用改进后的中值滤波法[3]:

f (x, y) {mid (x, y) , if|g (x, y) -mid (x, y) |>δg (x, y) , other

其中g (x, y) 为滤波前灰度值, f (x, y) 为滤波后灰度值, mid (x, y) 为滤波窗口内中间点的灰度值, 为阈值。如图8为阈值为108时拍摄图像的噪声消除后图像。

3.3 边缘检测

针对AGV路径图像简单、内容比较单一、色彩少、引导线和背景对比强烈、尤其是边缘线比较突出等特点, 采用轮廓提取法。Roberts边缘检测算子采用的是对角方向相邻的两个像素之差。从处理的实际效果来看, 边缘定位准, 对噪声敏感。Roberts算子是一种利用局部差分算子寻找边缘的算子[4]。

经过对拍摄的图片处理计算后结果如图9。

3.4 直线拟合

AGV的摄像头离地面很近, 视场很小, 且白色路径的曲率很小, 所以可将路径近似认为是直线。假设隔行扫描整幅图一共需要mn列, 可得到坐标系puvxoy的转换关系:

x=u-m-12;y=-[v-n-12] (1)

摄像头逐点扫描像素行 (从左到右) , 对于相邻两点, 用右点减左点灰度值B, 在这里可以设定一个值k, 凡差在k以内的都近似认为是黑色点, 为路面, 即此时Br-Br-1≤k, 这样一直到Br-Br-1>k的时候可以认为点已经为白点, 即路径点。假设此点的坐标为 (u1, v1) , 当Br-Br-1≤k的时候, 说明此时的r点已经为黑点, 假若此点坐标为 (u2, v2) , 则此像素行上的路径中心线上的点坐标为:

u0=u1+u22, v0=v1+v22 (2)

在获得若干组坐标之后, 通过最小二乘法对数据进行拟合, 即如果被测数据满足线性关系式

yi=A+Bxi, 由拟合公式得到方程 (3) 。

Au+Bv+C=0 (3)

把式 (3) 带入式 (1) 得到:

Ax-By+[m-12A+n-12B+C]=0 (4)

由式 (4) 可以得到:

e=-[m-12A+n-12B+C]A;a={π2-|arctan (AB) |, AB>0|arctan (AB) |-π2, AB<0

该算法在三维AGV仿真平台中应用并验证, 取得了良好的拟合结果。如图10所示。

4 结果分析

为了验证小车在全部运动过程中路径识别跟踪的可行性, 本文在AGV仿真平台上以角度偏差为5度, 距离偏差为0的初始值, 对AGV采集处理图像进行跟踪, 记录一定时间内系统计算出的距离偏差和角度偏差, 小车的运动轨迹如图11所示:

可以看出, 小车在初始角度为5度的情况下, 通过识别引导线对小车进行控制, 最后可以自动调整角度最终回到正确位置和方向。

5 结论

通过在基于DSP芯片、PID控制算法的AGV样机上试验, 本文中处理方法既能获得较好的滤波效果, 同时又不丢失标识线边缘的细节信息, 运算量小, 能够较好地满足自动引导车的实时控制要求。而采用最优阈值选择法, 能够使灰度突变点被错误识别的概率更小, 保证了标识线边缘点识别的可靠性。这样可以大大加快路径识别的速度, 提高系统的实时性和提高AGV的精度。

该图像处理方法在AGV视觉导引控制中的应用有利于AGV从固定线路向可调整线路、从原始的段、点定期通信到先进的实时通信、从落后的现场控制到先进的远程图形监控等方向发展。

参考文献

[1]江伟, 王荣本, 敦克友.基于机器视觉引导的两轮差速转向AGV控制问题的研究.机械与电子, 2002; (5) :51—55

[2]杨淑莹.VC++图像处理程序设计.北京:清华大学出版社, 2005

[3]朱军, 叶庆泰.基于DSP的AGV视觉导向系统研究.计算机测量与控制, 2003;11 (3) :236—240

视觉处理 篇8

科技日报讯 (记者常丽君) 科学家在研究与视觉相关的脑处理过程时, 发现视觉皮层不仅能利用眼睛看到的视觉信息, 还能利用耳朵收集的听觉信息。他们认为, 这种听觉输入让视觉系统能预测即将到来的信息, 从而成为一种生存优势。相关论文发表在最近出版的《当代生物学》杂志上。

据物理学家组织网5月26日 (北京时间) 报道, 该研究是一项为期5年的名为“背景反馈与预测的脑部阅读”项目的一部分, 由欧洲研究委员会、生物技术与生物科学研究委员会资助。该研究用功能磁共振成像 (f MRI) 进行了5项不同实验, 观察了10名志愿者的早期视觉皮层的活动。

其中一项实验是让志愿者蒙住眼睛, 听3种不同的声音:小鸟唱歌、交通噪音和众声嘈杂。脑部早期视觉皮层在处理不同的声音时, 会有不同的模式, 研究人员利用一种特殊算法能识别出这些独特模式, 从而把不同声音区别开来。而另一项实验则揭示了在没有其他视听信息, 早期视觉皮层处理这些声音信息时, 志愿者所想象出图像。

该研究负责人、英国格拉斯哥大学神经科学与心理学院教授拉斯·穆克里说:“声音也能产生视觉图像、心理图像和自动心理投射。比如你走在大街上, 听到拐角处传来摩托声, 你预期将看到一辆摩托车, 结果转过弯却发现是一匹马, 你就会非常吃惊。”

传统上认为, 人类的早期视觉皮层只能处理简单的视觉信息, 如方向、对比度、空间频率等, 而非视网膜的信息会对早期视觉皮层产生什么影响, 人们尚不清楚。穆克里说:“这项研究增进了我们对不同脑区之间相互联系的理解。以前人们不知道早期视觉皮层还能处理听觉信息, 只有对猴子的一些解剖学上的证据。我们的研究首次在人类身上清晰地显示了二者间的关联。今后, 我们将进一步实验听觉信息是怎样支持视觉处理的。目前我们的假设是, 这能提供一些预测功能, 帮助视觉系统专注于意外事件, 从而带来一种生存优势。”

穆克里还指出:“这种机制可能深入揭示那些有精神问题的人, 如精神分裂症、自闭症患者的精神状态, 帮人们理解他们在感觉认知方面有何异于常人的地方。”他们还将进一步研究, 以发现大脑是怎样对声音进行精确的预测编码的。

总编辑圈点:

客观物体直接作用于我们的感觉器官, 在人脑中形成反应, 便有了知觉。这其中, 视觉与听觉成为我们感知世界最基本的两种方式。已有研究证明, 人类的各种感觉模式, 如视觉、听觉、躯体感觉、嗅觉、味觉等, 其间存在相互作用, 大脑能优先注意某种信息而忽略其他信息。而最新的这项研究向我们进一步证实, 视觉与听觉间的这种关联在物质层面的反应, 也将增进人类对不同脑区间相互联系的理解。我们期待类似的研究拓展到各个感觉模式中, 并继续深入下去, 带给我们更多的惊喜。

(中国科技网)

上一篇:经贸工作下一篇:潮州市城乡