旋转物体(精选3篇)
旋转物体 篇1
0 引言
当前我国的制造业已达到以信息化带动工业化的新阶段,因此自动化水平在当今社会起着非常重要的作用。在生产线上利用工业机器人普及智能化已成为当今社会的必然趋势。在机器人抓取系统中,物体的识别和定位对整个生产流程的效率有很大的影响,其中最重要的是对物体的旋转角度的快速准确获得[1]。
现有的测量角度的方法很多,文献[2]中提出了一种室内空间测量定位系统,结合多面棱镜和平行光管作为调整手段的角度测量系统,周星炜提出基于光纤Sagnac干涉仪的敏感角速度光纤传感器结合单片机的方式测量角度[3],上述方法角度测量均达到了很高的精度,但是光学测量系统对条件要求较高且系统复杂,所以其适用性受到限制;计算机视觉测量具有非接触、高速、高精度的优点,近年来基于图像的角度测量方法也有很多,其中包括利用图像的轮廓特征和利用物体的局部特征点法。白福忠等[4]提出对采集到的被测工件图像进行边缘检测、细化处理和霍夫变换来确定物体的旋转角度,该方法得到了较好的效果。但是对于轮廓缺失或是图像中直线特征不明显的情况适应性较差;文献[5]针对任意角度图像配准提出利用基于Zernike矩的互相关算法也达到了0.1°的测量精度;尺度不变特征变换SIFT[6]由David Lowe在1999 年发表,2004 年完善总结,SIFT特征是图像的局部特征,对旋转、尺度缩放、亮度变化保持不变性,对视角变化,仿射变化噪声等也保持一定程度的稳定性,而且具有独特性、快速性、高速性、可扩展性等好处,因此自SIFT出现以来就受到广泛关注,应用SIFT测量角度的方法也层出不穷。朱齐丹等人[7]利用SIFT得到的特征点的主方向结合聚类分析对角度进行测量,但是由于算法中主方向是将圆周的方向分成36 份进行计算,自身就会有1°左右的误差,利用SIFT特征点分别结合OTSU,RANSAC[8]和矩阵[9]的方法被提出,它们均可准确计算物体的旋转角度。但是上述方法均受制于SIFT本身,因为SIFT要完成尺度空间极值检测,关键点定位,主方向确定及128 维描述子的建立等,所以需要消耗较多的时间。
二进制鲁棒不变尺度变换BRISK[10]是由SIFT发展而来,也是一种求局部描述子的方法,在将BRISK用于家中服务机器人的识别[11]和索春宝等人[12]利用Mikolajczyk和Schmid所提供的数据集[13]比较了SIFT,BRISK等几种方法在旋转、尺度、光照变化下的鲁棒性对比中,BRISK均表现出较高的时空效率和实时性。由此提出用BRISK来计算物体的旋转角度,由于BRISK匹配点的精度较低,因此在利用汉明距离筛选出匹配点后,选定匹配点间的最小汉明距离为参考值对得到的匹配点进行二次筛选来提高配准点的准确度。将最终的匹配点对分别结合OTSU[15],矩阵及中位值法来求取物体的旋转角度及所需时间,并对其抗噪性能和对轮廓缺失及其他不同情形下的鲁棒性进行测试。
1 BRISK算法的基本原理
BRISK[10]之所以具有低计算复杂度,关键在于应用了由Mair[16]等人提出的对FAST(Features from Accelerated Segment Test)特征点检测算法扩展的AGAST角点探测算法来提取角点特征和基于强度对比的二进制比特串图像块描述方法。BRISK算法的实现过程包括:① 特征点提取;② 特征点描述与匹配。
1.1 特征点提取
为保持尺度连续,BRISK也是先构建尺度金字塔,包括n层ci以及n个内层di(i=0,1,…,n-1)。ci从源图像开始由上一层以系数为2 的降采样得到,内层di处于层ci和层ci+1之间。第一内层d0由源图像下采样1.5 倍得到,其余内层通过上一内层半采样得到。若t表示尺度,则每层的尺度t(ci)=2i,t(di)=2i×1.5。在高斯金字塔上检测特征点:首先计算每层的FAST[16]得分,如图1,选取FAST9-16 的模型,即在圆周的16个像素,中心像素p至少连续高于或低于其中9 个像素,利用阈值τ 得到潜在的关键点。具体见文献[10]。
1.2 BRISK特征点描述和匹配
BRISK使用二进制字符串来描述每个特征点,每个特征点利用512 位的字符串进行描述,过程如下:利用以像素点为中心的一个半径为3 pixels的离散化的Bresenham圆,如图2 所示,圆周上共有60 个均匀分布的点,共60×(60-1)/2=1 770 个点对,由长距离采样点对和短距离采样点对分别估计特征点方向和生成二进制描述子。由于这种采样模型在采样时会产生灰度重叠,所以BRISK中先使用方差为σi的高斯函数平滑每个采样点,并且σi与采样点在各自的圆圈上的距离成正比。这1 770 个采样点对(pi,pj)的平滑强度值分别设为(pi,σi)和(pj,σj),则两点间的距离梯度:
定义短距离采样对的S子集和长距离采样对的L子集分别为
阈值 δmax=9.75t,δmin=13.67t,t为关键点的尺度。由于长距离采样点对包含有更多的特征点角度信息,并且局部梯度相互抵消,因此在集合L中计算关键点的模式方向为
为了保持旋转不变性,仿照SIFT,将坐标轴旋转到特征点的主方向,然后再次采样。最后在集合S中对所有的点对进行像素值比较生成二进制描述子。
1.3 特征点的二次阈值筛选
在BRISK中,利用二进制描述子对特征点进行描述,匹配点对的获得往往是通过对关键点对间的汉明距离设置特定的阈值。阈值的选取对匹配点对的选取有很大的影响,当阈值越大,留下的匹配点对越多,匹配点对间的相似度就越小;当阈值选取过小,我们就只能得到很少一部分匹配点,甚至得不到匹配点。因此提出二次阈值的方法,当利用通常设置的阈值对关键点筛选后,利用初步得到的匹配点对间的最小汉明距离为参考值,保留汉明距离小于参考值二倍的匹配点来完成对匹配点对的进一步筛选,由此可以减少第一次阈值的选取对匹配精度的影响,而且可以保留汉明距离最小,也即特征点间最相似的点,下文将对该原理的结果进行具体的验证。
2 角度测量原理
2.1 仿射变换
仿射变换是二维平面中一种重要的变换,仿射变换包括旋转、平移、翻转、错切变换。当图像在X和Y方向缩放比例相同,沿Y轴做剪切变换时,其复合矩阵为
式中: Δx 、 Δy表示将一点(x,y)移动到(x+Δx,y+Δy)的移动量;s表示尺度缩放因子;ψx表示纵向剪切角度;θ 表示目标图像相对原图像的对应像素的旋转角度。实验中对仿射矩阵的求取利用find Homography,数据处理方式选用CV_RANSAC。
2.2 中位值法
中位值是利用求得的匹配点的精坐标,找到在源图像中的两条直线的斜率k1,并找到目标图像中对应的匹配点组成的直线的斜率k2,由k1,k2计算图片旋转角度。在得到的多个匹配点中,考虑到精度和速度的要求,当匹配点对超过50 对时,隔点选取50 个点组成的1 225 条直线进行计算,将对应直线求得的斜率按大小顺序排列,取中间值作为测量结果;匹配点对不超过50 对时,将所有点参与运算,求其中位值。
2.3 最大类间方差
最大类间方差(OTSU)[8,15]是一种自适应求取阈值的方法。再利用OTSU得到的阈值对图像进行二值化处理,结合二值化图像中像素不为0 的点为对象和图像中利用BRISK求得的匹配点的像素坐标,求得两部分的共有部分作为目标点对,仿照中位值法,利用源图像中任意两匹配点组成的直线的斜率k1和对应在匹配图像中的两个点的斜率k2计算旋转角度,最终对所有求得的角度值利用三倍的标准差进行处理,将处理后的值作为最终的角度值。
3 实验结果与分析
实验采用Intel(R) Core(TM)i5-2520M CPU@2.50 GHz的处理器,RAM 4.00 GB,测试图片如图3(a)使用标准图像数据库[13]、标准图像库[14]中的baboon和plane及图片nut,测试图片均利用ACDSee软件进行旋转,程序是在VS2010+open CV2.3.1 下进行,环境设置为RELEASE。
3.1 旋转角度的测量精度
图4,5 分别介绍了BRISK利用二次阈值筛选前后的匹配点结合OTSU,矩阵,中位值三种方法测量不同旋转角度时对应的旋转角度的绝对误差值,表1 代表BRISK利用二次阈值筛选前后的匹配点数目。
从图4 可看出,利用筛选前的点结合三种方法可以大致确定物体的旋转角度,图像的特征点越多,测得值就越准确。从图5 可看出,利用筛选后的匹配点结合三种方法的测量误差基本都在1°以内,其中OTSU的测量误差大多在0.5 以内,且能保持较好的稳定性;利用矩阵法的测量结果在特征点数目多时效果较好,特征点数目少时相比其它两种方法来说波动较大,而且当点数少于4 就无法完成测量,但是矩阵法可计算六参数仿射模型,适用性广;中位值法的结果也比较稳定,利用上面图像测得的角度绝对误差均在0.5 以内,当特征点数目少时也可以得到好的结果,而且在图4 中匹配精度低时依然可以有较好的结果。对比图4 和图5 可以看出,经过二次筛选,旋转角度的测得值变得更精确。从表1 中的匹配点数目的变化可以看出,在经过二次筛选后,匹配点的数目大量减少,综合可说明,筛选后的特征点配准精度更高,筛选后的特征点的数目也大大减少,而这势必都会提高整个算法的效率。
3.2 测量旋转角度的速度
图6 显示了利用二次阈值筛选前后的点结合三种方法测量角度所需要的时间,通过对boat,plane,baboon三幅图片进行测试,结果可看出当特征点较多时,利用二次阈值筛选后的点结合三种方法测角度的时间明显缩短,当物体的特征点少时,两者的时间相差不多;三种测量方法,当图片较大时,OTSU所需时间最多,因为OTSU需要先对图像整体求取阈值进行二值化处理,图片越大消耗的时间越多,矩阵法和中位值法两者消耗的时间相差不大。改进后测量所需时间多在1 s以内,基本上可以满足实时性的要求。
3.3 算法对噪声的鲁棒性测量
上面的实验验证了利用BRISK测量角度的可行性,下面将对该算法对噪声的鲁棒性进行测量,此处用MATLAB给图片添加不同程度的椒盐噪声,实验图片选取boat和baboon,实验方法选取筛选后的点结合OTSU进行。表2 可看出添加噪声后测量精度有了一定程度的下降,但在一定范围内保持稳定,对图片添加不同程度的高斯噪声后也是同样的结论。
3.4 对轮廓缺失,光照变化,尺度变化等的鲁棒性测量
为研究算法在不同情形下的适应性如遮挡,光照变化,模糊,尺度缩放时的稳定性,实验选用图7 中baboon和plane(遮挡),并且利用牛津图像库中的bakesimg1-3(模糊变换)和leuvenimg1-2 及boatimg1800 缩放50%,实验结果如表3,对比轮廓缺失前后的值可以看出,轮廓缺失前测得的角度值的精度高于轮廓缺失后的角度值的精度,但是轮廓缺失一部分测得的角度值的误差虽说较大,但是仍然保持在1°以内,当图片发生光照变化,尺度缩放还有模糊变换时算法的精度依然很高。
°
°
4 利用自己拍摄的图片进行测量
为了确保算法可行,利用实际旋转物体(图3(b))进行测量,由于图片是人为旋转,所以真实值会有一定偏差,因此将SIFT结合矩阵和中位值的结果作为参考值(由于实际拍摄效果欠佳,二值效果差,因此对OTSU的结果不予讨论),其结果如表4,得到了稳定结果。
°
5 结论
本文针对在传送带上传送物体,机械手参与自动化处理时,利用对物体方位的准确快速识别可以提高自动化实现的效率,提出利用BRISK的物体的关键点计算物体的旋转角度,针对BRISK本身特征点检测精度不够高的问题,提出对BRISK的关键点进行二次筛选,使匹配点更加准确。在试验中对选定的图片进行测试结果表明,利用BRISK结合OTSU,矩阵和中位值法测量旋转角度的绝对误差在1°以内,当特征点多时可以达到更高的精度,而且在计算物体的旋转角度时整个算法消耗的时间都在1 s以内,达到实时要求。除此之外,该算法对噪声及其部分遮挡,光照、尺度放缩均有一定的鲁棒性,达到了预期的实验结果。
旋转物体 篇2
一、活动目标:
1、在操作、探索活动中,发现转动的很多有趣现象。
2、积累有关转动的经验,了解转动是运动的一种方式。
3、为自己和同伴的成功而高兴,在活动中获得成功的喜悦。
二、活动准备:
1、轮子、塑料玩具、陀螺、小棒、积木、圆纸片、吸管等
2、绸带、音乐
三、活动过程:
(一)通过操作,让幼儿初步获得有关转动的经验。
1、师:小朋友,今天唐老师给大家带来了一个谜语,请你来猜猜它是什么?说它是辆车,可它不是车,风儿一吹来,脑袋随风转。你是怎么猜出来的?
2、幼儿探索操作,鼓励幼儿发现转动的各种有趣现象。
师:那除了风车能转,你觉得还有哪些东西是可以转的?今天,唐老师还给大家准备了很多东西,我们一起来看看有什么:风车、陀螺、电动汽车、纸片、吸管,它们能转吗?我们来试一试!
3、幼儿交流,鼓励幼儿将自己的发现大胆地告诉同伴,鼓励幼儿为同伴的.成功而高兴。
师:你玩的是什么?你是怎样让它转起来的?
小结:用嘴吹,用手转,用手拨,有手推,还可以借助辅助材料吸管穿过纸片,用手一转,纸片就转起来了等等。
讨论:这个东西到底能不能转?
教师小结:小朋友真动脑筋,想出来各种各样的办法让篮子里的东西转动起来了,而且发现了许多有趣的现象,真我惊讶,你们真棒。
(二)借助绸带引出身体的转动
1、出示绸带
2、幼儿在音乐中自由的玩绸带转动,教师巡回看。
3、提问:谁来说说你是怎样让你的绸带转起来的?(用手臂带着转,用身体带着转)
4、咦,我的绸带怎么没有转动呢?这是怎么回事啊?谁来教教我?
(小结:哦我们都发现了,绸带本身不会转动,是我们的身体转动带着它转动起来的,原来我们的身体也会转动,真神奇哦!)
5、师:请小朋友和老师一起来跳一个绸带舞!
(三)运用肢体动作感知转动
1、师:那我们的身体还有那些地方,哪些部位会转动起来,请小朋友找一找,转一转你的身体部位哦!(幼儿探索)
2、请幼儿交流:谁来说一说,你让什么转动了起来?请你上台来试一试
(舌头转、手臂转、辫子转、屁股转等等)
小结:我们的身体真了不起,有那么多的部位都能转动起来,让我们做事、运动更灵活了。
(四)观看视频,了解旋转的秘密
师:现在让我们一起来看一些关于旋转的图片和录象,看看旋转给生活带来的美感.
(五)拓展:感受转动给生活带来的方便。
师:风车的转动给大家带来了欢乐,汽车轮子的转动给大家带来了生活的快捷,电风扇的转动给大家又带来了凉快。各种各样的旋转让生活变的多姿多彩。生活中还有哪些东西会转动呢?小朋友回家和爸爸妈妈再找一找,把你找到的结果记录下来,可以带到幼儿园和大家一起分享!
活动反思:
本次活动由物体的旋转—身体带动物体的旋转—身体部位的旋转—观看一些旋转的表演,层层递进,把活动推向高潮。在活动中,我充分调动了孩子的积极性和主动性,让孩子了解用嘴吹,用手转,用手拨,有手推,还可以借助辅助材料都可以使物体旋转,让幼儿在观察、操作、交流、游戏的过程中,发现旋转的原理。
评析:
笑口常开
旋转物体三维影像投射的研究 篇3
随着投影技术的发展, 虚拟世界和现实世界有了一种很好地同步结合方式——三维影像投射。通过三维影像投射技术, 艺术家可以将虚拟世界创造的艺术作品与现实世界的物体进行同步, 完成虚拟世界到现实世界的转换, 将虚拟世界的内容通过异面投影技术真实的展现在人们面前。相对于传统形式, 三维影像投射技术更加自由, 任何可以反射投影光的物体都可以作为被投影介质, 而投影物体的立体性可以很好地增加投影内容的真实感, 可以很好地吸引观众的目光, 同时使用实时渲染三维影像投射系统可以便捷地更换显示内容, 丰富展示的多样性, 不会让人感觉到枯燥。
本文的研究课题就集中于一种结合投影仪和运动物体结合的新的系统。在目前三维影像投射方法的基础上, 保证虚拟世界与现实世界运动的同步, 同时保证虚拟世界与现实世界完全一致, 只有这样才能保证不需要调整模型点的情况下完成旋转的同步。随后需要创造一种可以实时变换投影融合带的算法, 使得旋转物体也保证投影仪可以完成融合, 只有这样才能保证成功。
2 渲染内容的简介
2.1 模型内容的建立
首先需要明确的是三维扫描后录入的数据其形式。通过三维扫描仪录入电脑的是点云, 及每一次激光反射的位置和距离, 这样的一系列点集构成了整个模型的点云。通过三维扫描仪自带的软件进行补洞操作后, 完整模型就完成了, 但是补洞的模型只有大致形状, 没有任何走线, 所有面由无数小三角面构成, 显然这些密集的三角面是不能作为虚拟模型加载的, 图2:模型参数传输序列图其占用资源过多, 需要进行拓扑。
在获得了已经补完洞的模型后, 需要对模型进行拓扑。拓扑的方式完全依靠模型师的经验和手法, 如何体现物体的细节, 如何保证拓扑的模型既与原物体基本一致, 又要保证尽量少的走线, 这些都与模型师的经验息息相关。总的来说拓扑的最佳结果是保证最少的走线和最佳的模型形状, 尽量贴合三维扫描的的模型, 满足上述条件的拓扑模型才是比较好的模型, 相对来说技术要求较高。
获得拓扑模型后需要将其转换成vvvv可以识别的模型形式, vvvv主要使用Direct X进行渲染, 使用的也是Direct X默认的后缀名为.x的模型文件, 默认包含两部分, 包含模型文件以及动画键。MAYA和3DMAX都有其转换插件, 这部分交给插件即可。
最后需要对模型文件进行加载, vvvv中加载模型文件有自己的节点, 但是只提供了基本的模型信息, 其余的位移、旋转、变形矩阵等信息需要自行设计, 基本设计如图1所示。
至此, 模型模块从录入、拓扑、到加载完成了一整个的流程, 成为了构建虚拟空间的基础。
2.2 实时渲染的设计
拥有模型之后, 虚拟世界才算是有建立的基础, 实时渲染的基本要素如图2所示:
构成本文虚拟空间的基本要素如上图所示, 分别是:
(1) 模型:在获得拓扑模型后, 转换成vvvv可以识别的模型文件, 同时要保证文件的UV合理展开, 保证模型的大小合适, 方便调整。满足如上要求才算符合要求。
(2) 着色器:Direct X拥有自己的渲染器, 需要利用其自己的语言来完成对模型渲染的操作, 包括灯光、融合拼接等。
(3) 摄像机:作为与现实世界同步的虚拟构建, 摄像机的参数需要保证与投影仪的参数完全保证一致, 焦距, 高度, 距物体距离, 中心位置等等, 必须与现实世界同步。
(4) 相对位置信息:除基本的位置、角度信息外, 物体与物体之间的相对位置也需要保证, 其中之后同步阶段需要虚拟世界和现实世界保持一致的旋转参数等。
(5) 艺术视频文件:在UV基础上根据艺术内容进行加载的图形视频文件, 对于艺术设计而言, 这将是展现整个视觉效果的部分, 在之前艺术设计部分已经详细描述。
其中不得不说的是融合拼接的方式。一般的平面投影的拼接方式较简单, 根据融合公式即可进行较完整的融合拼接。但显然在不规则曲面上没有办法找到一个普适的算法可以让所有的物体都可以做到很好地融合。每一个投影仪根据其位置和角度不同, 所能显示模型的角度和大小都不可能完全一样, 所以类似平面上通过投影仪画面做切割进行融合的方式在异面投影上是不可取的。
异型投影的融合通常分两类, 一类是完全的硬拼接, 通常立方体等有明显面变化, 或者形状简单, 可以对模型形状和大小可以精确变换的模型可以使用硬拼接。另一类是软拼接, 通过划分融合带, 对两个融合带进行叠加来达到融合拼接的目的。本文的汽车没有明显的面与面的划分, 由于点数众多, 也没有办法进行精确的形状调整, 只能使用软拼接的方式完成融合。
根据汽车模型的特点, 其形状类似长方形, 故一台投影最多可以覆盖其中的三个面, 显然, 光路直线的原理表明, 投影仪最多只可能覆盖到三个平面, 不可能超过三个。
以汽车作为示例, 由于汽车的前面和尾部的面较小, 所以并不需要单独分割出来, 连接到汽车顶面即可, 故整个分割方案如图3所示:
红色和绿色线内为融合带, 通过融合算法进行软拼接, 具体如何形成软拼接的将在实现章节详述。
完成着色器后, 需要对模型的位置, 摄影机的位置等相对位置进行确定, 之前已经提到。
至此虚拟世界部分设计基本完成, 从模型的构建到渲染再到同步接口的设计, 完成了虚拟世界的构建。
3 渲染结果
通过实时渲染软件对三个部分进行实施渲染, 后通过三台投影仪分别对分割部分的图像进行输出, 最终完成现实世界和虚拟世界的匹配, 对三个投影图像进行软拼接, 形成完整的去昂防伪覆盖汽车投影, 如图4所示:
经测试, 融合带基本完全覆盖, 顶部有少许偏差, 数以正常范围允许之内, 算法分割成功, 解决了运动物体全覆盖投影的难题。
4 结束语
通过对输出图像进行精确的分割, 并结合融合带, 最终完成了三台投影分别输出不同图像, 覆盖整个物体的方案, 以此类推, 可以完成任何形状和大小的物体投影覆盖方案, 只要物体处于投影仪投影范围以内, 都可以通过对物体进行分割渲染的方式, 完成物体图像的拼接, 最终形成完全的图像覆盖方案, 做到对旋转物体的三维影像全投射。
摘要:三维影像投射, 也称为影装、异面投影, 是一种通过投影仪将虚拟空间中实时渲染的三维影像投影到实体物体上的技术。本文所设计的系统是在现有宣发基础上, 进一步研究虚拟世界和现实世界的关系, 完成两者的同步, 保证虚拟世界和现实世界的一致, 利用虚拟摄像机代替投影仪位置, 虚拟摄像机拍摄到的内容即是投影仪需要显示的内容。最终达到虚拟世界物体跟随现实世界物体转动, 实时渲染输出图像, 使得现实世界中物体不断转动也能保证可以实时覆盖投影内容。
关键词:旋转物体,三维影装,三维影像投射投影仪
参考文献
[1]张杨林, 杨红雨, 唐荣, 邓昌胜.分布式曲面投影系统几何校正算法的研究[J].微计算机信息, 2009 (36) .