图像获取

2024-10-04

图像获取(共9篇)

图像获取 篇1

一、地理图像资源特点的分析

随着图像信息时代的到来, 地理图像不再局限于教材中的景观图、示意图、分布图、等值线图、统计图表和地形剖面图, 更包含了形式多样的电子地图、视频录像及教具模型, 充分地展现了地理事物时空分布特征和变化规律。根据笔者对教学的认识和体会, 总结了地理图像的四个主要特点。

1. 简明直观性

地理图像不仅可以表示事物的形象特征、分布规律和时空变化特点, 还能反映现象之间的相互关系。在表现大范围或全球性规律时, 这种直观感受性是文字表达难以达到的。

2. 区域综合性

地理图像在不同区域尺度上体现了地理要素特征及要素间联系的规律, 表达了地理学科的区域性和综合性特色。地理图像不是单个信息数量之和, 具有丰富读图经验的用图者可以从图中获取多于制图要素的综合信息。

3. 科学规范性

地理教学用图以体现地理科学规律为主旨, 按照一系列技术和制作规则进行编绘, 保证了图像的精度和规范性。学生通过科学规范的图像学习, 逐步形成理性的科学思维和严谨的科学态度。

4. 生动形象性

地理图像超越文字表达的限制, 以优美的构图和鲜明的色彩展现生动形象的地理世界, 迅速地唤醒学生的地理思维, 直观地从图像中获取事物具体而形象的大量信息。

二、地理图像资源的运用现状

在新课改中图像教学受到了广泛的重视, 但是教师的图像教学观念、课堂教学表现都与新课程理念之间存在一定的差距。分析有关高中地理教师图像资源运用现状的研究文献[1], 发现以下几方面的问题表现得尤为突出。

1. 教师在课堂上用图数量少且频率低;所选用的图像类型单一, 以课本图、板图和挂图为主, 电子地图、视频等新形式图像在课堂上运用得很少。

2. 教师使用的部分图像内容陈旧, 难以解释地理现象变化后的新情况;多数图像内容脱离实际生活, 缺乏知识与实际的结合点, 造成学生对地理知识乏味无实用的印象。

3. 教师选用的图像难度不恰当。高中学生随着心智发展对科学产生了研究和探讨的兴趣, 内容过于简单、缺乏思考挑战性的地理图像难以促使学生积极主动地投入学习。

4. 教师缺乏创新设计图像的能力, 虽然能够发现已有图像的不足之处, 但是没有掌握对其进行改善的方法和手段。

出现以上问题的原因主要是教师图像资源储备不足, 获取图像资源能力欠缺;利用现代化手段制作或改进图像的能力较低, 传统板图方法被忽视。如果能够拓宽获取地理图像资源的渠道, 在丰富且有效的图像库支持下, 教师开阔的教学思路将使地图教学更加高效。

三、地理图像资源获取的五大途径

1. 比较法———筛选优质图像

(1) 比较国内多版教材

各版本地理教材在教学内容、章节顺序和图像设计方面各具特色。教师应该做到熟悉并揣摩比较各版本教材, 思考同知识点的不同图像的优劣, 借鉴优质图像。例如“大气的受热过程”知识点, 湘教版与人教版的图像相比, 强调了三种辐射的数值、形成及相互关系, 清晰的逻辑使学生更容易理解。

(2) 借鉴国外主流教材

欧美国家地理教材中图像的设计注重编排的系统层次性、内容的实用可操作性以及色彩的形象生动性。在广泛阅读的基础上了解图像设计的先进理念, 提高鉴别优劣图像的能力。例如说明“搬运作用对地貌的影响”, 可参考美国高中地理教材《科学发现者》上册第141页图6-2, 组图包括亚利桑那州纳瓦霍印第安人居留地的沙丘、加拿大魁北克白朗萨布隆峡谷中的河流、魁北克的崩塌和加拿大杰士伯国家公园的萨巴斯卡冰川, 形象生动地展示了引起搬运的四大自然因素、搬运过程及典型地貌。

(3) 甄选应用教辅资料

地理教辅资料与教材相比其优势体现在信息材料更新快、时效性强, 紧密结合教材、同步性强, 整合知识点、综合考察性强。优秀地理教辅资料的编排将图作为逻辑思考的起点, 以图设疑组织教学情景, 围绕知识点而设计简明突出的教学图像, 为教学图像的选择及学案的编写提供了很好的素材。

2. 引入法———获取适用图像

(1) 参考知名地理报刊

美国《国家地理》各项主题的照片充分展示了珍贵的自然细节和灿烂的人类文明。《华夏地理》与《国家地理》长期合作, 在采用同期用稿时也增加了大量中国本土地理内容。《中国国家地理》涉及中国本土和世界各地的自然和人文景观, 揭示现象背后的奥秘与规律, 其图片科学性和可读性强。网站http://ngmchina.com (《中国国家地理》) 和www.dili.360.com (《华夏地理》) 设有各项主题图片库, 以及便捷的下载途径。

(2) 发掘相关百科全书

《中国中学生百科全书》不仅普及地理知识, 还重视对中学生物理、化学和生物科学与环境关系理解力的培养, 其中的《天文.地理》分册与地理教学联系最为紧密。《中国大百科全书》第三卷中包括民族、宗教、风俗、历史、地理、名胜, 插图3万幅, 地图1000幅。全书适应社会变化, 内容深入浅出, 阐述准确科学。利用百科知识宝库发现地理与相关学科的结合点, 拓展地理学习的深度和广度。

3. 时尚法———选用热点图像

(1) 关注权威科普视频

地理科普视频以通俗有趣的角度展开对世界的观察, 以严谨的考证方式体现地理的科学性。BBC、Discovery、NGC (国家地理) 的科普视频主题广泛而有代表性, 教师应敏捷地发现其中对教学有益的内容并进行剪辑运用。例如讲授洋流运动规律时, 搜索BBC网站可以找到相关的洋流视频“伟大的海洋输送机”, 可剪辑后用以讲解洋流形成的动力和规律。

(2) 留心每日新闻报道

以“生活中的地理”“有用的地理”课程理念为指导, 教师观看新闻报道时以地理人的专业角度去认识新闻现象, 鉴别与地理教学内容的关联度, 选择恰当的整合角度和方式将新闻信息运用到课堂教学中。根据教学内容的要求, 可以选择合适的新闻图像作为新课导语, 或是作为论据支持科学观点, 或是作为问题情景开展案例探究[2]。

(3) 发挥电子地图优势

电子地图内容涵盖旅游、交通、城市、人口、资源、环境和社会经济, 层次分明且设计贴合实际, 可将其整合到中国地理及国土整治的教学中。例如图雄网提供了全国各分区的三维地图和文字介绍, 不仅可以呈现道路格局、河流分布和量算距离, 还能编辑地图中的点、线和属性介绍。央视国际地图中心、世界地图集、中国空间信息网、中国地图出版社, 以及各地的旅游网站和交通网站都提供了大量电子地图参考资料。

4. 创新法———设计特色图像

(1) 运用制图软件绘图

教师具备了动手制图的能力, 才能摆脱教材图像的局限更专注重难点问题的解决。常用制图软件包括Word、Visio、Flash、Photoshop。例如Visio软件的特色是形状工具, “地图”可绘制城市简单布局示意图, “框图”可绘制地球仪的主要经纬线, “图表和图形”可建立数据图表, “流程图”可制作事件发生的过程图。

(2) 日积月累自拍照片

在充分熟悉教材内容的基础上, 对拍摄对象进行细致的观察判断, 选择有价值能说明问题的特征点进行拍摄。教师对自拍照片中的事物特征及联系的深刻认识, 使图像地运用更准确、事例材料更有说服力。

(3) 手工制作教具模型

利用教具模型学习自然地理能帮助学生建立起空间概念, 让学生在动手操作中掌握各要素间的变化关系。例如利用塑料板制作“简易地球光照模型”, 通过调整“太阳直射点”的位置可以演示太阳直射点的移动、正午太阳高度、昼夜长短及分布和晨昏线的移动规律。

(4) 重视课堂板图功能

板图是对知识的高度提炼, 呈现方式明快且重点突出。板图的设计强调以巧妙构思在图中设疑, 在图中展现逻辑规律。课堂上的边讲边画能将学生的注意力集中到图上, 以图为手段来理解和探讨地理问题。

在图像信息时代, 学生认知能力和探究兴趣的增长对教师图像教学技能提出了更高的要求。教师不仅可以收集教材、期刊、网络上与地理教学有关的图像材料, 以最佳的结合点整合到课堂教学中;也可以根据教学需要, 利用现代软件或传统板图来设计贴切的教学图像。从地理专业角度出发, 关注获取地理图像信息的多种渠道, 提升地理图像资源开发能力。以此为目标形成专业习惯才能积累丰富的专业经验, 实现专业教学能力的迅速成长。

参考文献

[1]刘桂侠, 张逸令.高中阶段地图教学现状研究.中学地理教学参考, 2004 (3) .

[2]章玲.家事国事天下事, 事事关心, 让新闻为地理课堂增添活力.教学月刊 (中学版) , 2005 (4) .

图像获取 篇2

教学目标:

1、学生能积极参与到设计制作“图文故事”的活动当中;

2、学生能够通过各种途径获取图像;

3、学生能够通过自主学习,对图像素材作简单处理;

4、学生有兴趣讲述自己设计制作的“图文故事”,并且阐述制作过程中运用的技术手段。

5、通过“动物”为主题的图文故事,传达出爱护动物,人类与动物和谐共生的环保理念。教学重点:

引导学生根据自己的故事立意,尽可能通过各种方法获取所需的图像资源 教学难点:

通过专业的图像处理软件对图像进行加工和处理 课时安排:第四课时 教学过程:

一、创设情景,提出任务

1、通过广播教学展示两个网页上的精美的图文故事:《习惯了一个人》、《致世界杯的斗士们》一个好的创意+一组精心筛选的图片+一两行“点睛”的文字=一个精美的图文故事。

2、展示一些学生课前搜集的图片,包括数码图片和传统照片。动物是我们亲密的朋友,请你以“动物”为主题设计制作一个图文故事(以幻灯片的形式展示),立意不限,上传教师机。

二、学生活动

1、获取图像观测记录:学生获取图像的途径五花八门。因为课前布置了相关准备工作,有的学生已经搜集了一些图片放到自己的邮箱或者U盘里,有的决定全部从网络上找寻素材,有的带来了拍摄了宠物照片的数码相机,有的带来了已经冲洗出来的传统照片。教师协助学生扫描传统照片,并且将移动存储器中的图片资料导入服务器中的共享文件夹,以方便他们在学生机上使用自己的图片。这个步骤看起来浪费时间,但是却是学生体验的重要一环,比如扫描图片与数码图片的导出哪个更快捷,哪个得到的图像质量更好,而且学生用自己的拍摄图片制作图文故事积极性更高,也更能表达他们自己的故事创意。大多数九年级学生对网络搜索引擎有一定了解,少部分对图片的搜索和下载还不太熟练的,也能在学生之间的交流协作中得到帮助。

2、图像的处理学生在设计制作过程中,因为缺乏图像处理的实际经验和技术手段,往往不太重视对素材进行再加工,教师及时的提醒是必要的。广播教学,展示以下几组图片: 第一组:

师生点评:这是一幅扫描图片,扫描使图片色彩亮度和鲜艳度都受到了损耗,处理之后画面明显有了改善。

第二组:

师生点评:文字的点缀使图片就像有了生命一样,瞬间活了起来 第三组:

师生点评:

铁路的画面用黑白来表达更有质感,充满了怀旧的气息以上几组图片的对比让学生切实体会到图片处理之后能够表达的情感可以更加丰富,意境更加深远,图像的处理用到一个图像处理软件——photoshop,这里不一定要学生都按照老师展示的图片来正进行修改,只是为了调动他们认识和学习图像处理软件的兴趣和积极性,一旦有了兴趣,学生的潜力是无穷的。他们可以继续在活动中通过自主学习和相互讨论对photoshop有一个初步认识。有关图像的处理,本课对学生们只提出一个具体要求,希望每个人的图文故事里的图片大小都是基本一致的。

观测记录:

学生都很有兴趣尝试着使用photoshop来修改图片素材,有了画图软件作为基础,他们对photoshop工具箱的模样并不陌生,能够试着使用矩形选取工具来截取图片和使用文字工具添加文字等。能够自觉地阅读教材的这一部分,配合观察各个菜单选项。

三、展示作品学生到教师机通过广播教学向全班展示自己设计制作的图文故事,并简述自己的立意和制作过程(包括怎么获取图片和对图片作了怎么的处理)。观测记录:这个过程中充满了惊喜,图文故事的题材各有精彩,有的展示自家宠物的俏皮,有的关注动物保护,有的以第一人称讲述动物的心情故事。因为每个人都全程体验了设计制作过程,在阐述自己的制作过程时都能说到一些知识点,还有学生得意地展示自己摸索出来的处理图片的小技巧。整个展示过程活跃有序。

四、总结归纳师生共同归纳获取图像资源的方法:

1、通过网络获取;

2、通过数码相机、摄像头等拍摄设备获取;

3、通过扫描仪扫描照片或报刊杂志上的印刷图片获取;

4、通过在绘图软件绘制获取;

5、通过截取或抓取图像和影像资料等方式获取;观测记录:能够感觉到学生的思维很活跃,完全没有局限于教材上提到的两种方法,归纳出了获取图像的若干种方法和途径。

教学反思:

图像获取 篇3

CAD/CAM技术是计算机技术在零件设计生产上的技术飞跃。随着CAD/CAM技术的广泛应用,方便了工程设计,提高了图纸存储和检索的效率。但是目前,很多工程图仍以图纸的形式保存,因而无法重复利用,每次修改都要重新绘制。为了高效率,可将纸质图纸扫描输入电脑,生成图像形式的数据。而且某些产品在设计时,其轮廓曲线是人工方式绘出的图样(如制鞋业的鞋底廓线和艺术品的廓线),或以某种形式用放样技术给定图纸,这些图纸也可以扫描生成图像数据。

图像数据不能为CAD/CAM直接利用,必须将其转换为矢量形式的坐标数据,可以直接利用图像处理技术生成矢量坐标数据,但其适应性不强。为此,笔者提出用人机交互绘图的方式,自动生成若干段逼近图像廓线的贝塞尔曲线。

1 获取点位坐标的原理

图像文件中的有效数据实际上是一个二维大型矩阵,矩阵中的每个数据代表一个像素点,每行或每列像素之间的距离(即分辨率)是由生成图像的设备(如扫描仪)决定的,用于点阵数位图像。点的距离delt和分辨率DPI的关系为:delt=25.4/DPI(mm)。当图像文件通过计算机映射到窗口上后,每一个点在图像中的坐标,如果以点距作为单位,其x坐标就是列数、y坐标就是行数。所以要获取廓线上的点坐标,就要分别找出像素点的行、列值。

在PC机上,通过鼠标可以锁定廓线上的给定点,在Windows操作系统中,鼠标可随时从系统内核获知其指向点的屏幕坐标。然后通过API函数可以确定指向点在显示窗口的现对位置,以及相片或图纸相对于窗口的偏移。因此,通过鼠标就可以获得当前指向廓线边缘像素在相片或图纸中的位置,这个位置是以点距作为单位的xy坐标,其真实坐标(X,Y)=(x*delt,y*delt)。

要得到正确的坐标数据,必须确定窗口、物理屏幕和工程图三者之间的关系(图1),dx、dy是显示窗口和物理屏的偏移关系,du、dv是图像的相片与显示窗口的偏移,利用API或MFC提供的函数可随时获取(dx,dy)和(du,dv)的值。

2 廓线的贝塞尔曲线逼近策略

一个没有数学方程表达式的任意曲线轮廓,在一定精度下可以用直线、圆弧和其他曲线逼近。在同样的精度下,用直线逼近时需要的节点最多,而在工程中使用贝塞尔曲线逼近任意轮廓,可以用最少的节点达到最高的精度。在使用贝塞尔曲线逼近时,通常使用二阶或三阶贝塞尔曲线。二次方贝塞尔曲线的路径由给定点P0、P1、P2的函数B(t)追踪,其数学表达式为:

三阶贝塞尔曲线的路径由P0、P1、P2、P3 4个点在平面定义,其数学表达式为:

生成二阶贝塞尔曲线的步骤如下:

a. 在廓线上找出起点P0;

b. 在廓线上找出终点P2;

c. 任意选定控制点P1,绘出贝塞尔曲线;

d. 调整控制点P1,使变动后的贝塞尔曲线与廓线最逼近;

e. 若逼近的情况不理想,可以适当修改P0或P2点的位置。

一段复杂的曲线往往不能由单段贝塞尔曲线实现,需要由多段贝塞尔曲线拼接而成。为使若干段贝塞尔曲线连接起来,下一段P0点的坐标值等于本段P1点的坐标值,即下一段曲线的起点与本段曲线的终点重合。

3 人机交互过程

人机交互设备使用鼠标,点击鼠标在应用程序显示窗口中确定起点、终点、控制点的位置,通过物理屏与应用程序显示窗口之间的关系,在物理屏上显示出来。具体过程如图2所示,调取绘制贝塞尔曲线的指令,确定起点的位置,起点确定后光标在移动定终点时,在物理屏上始终显示一条连接起点和光标的直线,这条直线随着光标位置的变动而变动。确定终点后就不再有直线随着光标移动了,得到一段不能确定形状的曲线段,这段连接起点和终点的曲线段随着控制点的定位`不停地改变形状,确定控制点的位置,得到二阶贝塞尔曲线。

为使当前贝塞尔曲线进一步逼近图像上的廓线,起点、终点和控制点都是可以调整的。按住Shift键同时点击控制点,即可得到三阶贝塞尔曲线,这样便于用一条贝塞尔曲线逼近有弧向转折的廓线。三阶贝塞尔也可以切换到二阶贝塞尔。在逼近达到要求时,按住Ctrl键同时点击终点就可以存储数据(起点、终点和控制点坐标)。在贝塞尔曲线存储之后,自动开始一条新的贝塞尔去曲线的交互绘制,其起点就是上一段的终点。在终点上点击鼠标右键,可得到封闭的曲线,即将当前曲线的终点自动设定为开始逼近的贝塞尔曲线段的起点。单段贝塞尔曲线的人机交互逻辑如图3所示。

4 软件设计

基于以上原理,使用Visual C++语言设计实现了一个贝塞尔曲线段逼近背景图像廓线的类CBesierCurve。类CBesierCuver挂可接于一个View类,实现在屏幕上人机交互输入和绘制三阶或四阶贝塞尔曲线的功能。

该类提供了将图像图纸显示在View中的函数和显示贝塞尔曲线段的函数DrawBesier(pDC)。前述人机交互功能的实现是在类中一个声明为UINT CBesierCurve::OnMouseAct(UINT Action,UINT nFlags,CPoint pt,CPoint orgPt)的函数中实现的,其中Action是鼠标的行为:

#define ACT_LBDOWN 0//鼠标点击左键

#define ACT_MOUSEMOVE 1//鼠标移动

#define ACT_RBDOWN 2//鼠标点击右键

参数nFlags表示鼠标按键和键盘上控制键的状态,用于检测鼠标动作时键盘上的Ctrl键和Shift键是否按下;pt为鼠标标定的点;orgPt表示当前窗口的坐标原点现对于图纸原点的坐标值,以便于计算鼠标标定的点在图纸中的位置。

函数OnMouseAct()在View对象中的WM_LBUTTONDOWN、WM_RBUTTONDOWN和WM_MOUSEMOVE的消息响应函数中被调用,这样就能够实现交互绘图了。

DrawBesier(pDC)要在View类中的OnDraw(CDC*pDC)被调用,实现图像型图纸和贝塞尔曲线的显示。

5 结束语

笔者介绍的方法实现了从图像到CAD/CAM系统的坐标数据的快速生成,可以用来处理工程设计和数学中二维曲线的输入问题,不但直观快捷,而且其拟合精度达到了一般工程设计要求。该方法可以广泛地应用于各种不规则平面图的设计与绘制,具有广泛的使用价值。笔者只介绍了采用鼠标输入的方式,为了更好地体现人机交互的实用性,建议采用多种输入方式混合使用,即一个应用程序采用多种控制方式,使用几种不同的输入设备。

摘要:产品设计过程中会遇到以图像形式给出的轮廓,在数控加工时也必须给出廓线的一系列坐标值。在此提出一种采用人机交互的方式,用若干段贝塞尔曲线逼近图像给出的廓线,实现从图像到CAD/CAM系统可以直接利用的坐标数据生成的方法。

图像获取 篇4

各位评委老师,你们好!我是来自XXX职业中专计算机专业的教师XXX,今天我说课的题目是《获取屏幕图像》。我将分五个阶段完成说课:

一、教材分析;

二、学情分析;

三、说教法;

四、学法;

五、教学过程分析。

一、教材分析

(一)教材的地位和作用

《获取屏幕图像》是出自高等教育出版社出版的《计算机应用基础》(windows XP +Office2003版)课本中第六章第1节。这节课是多媒体素材准备的重要组成部分之一,也是为后面学习处理图像做好铺垫。获取屏幕图像在工作生活中也比较常见,如课件制作、简单图片截取等。

(二)、教学目标

我结合《教学大纲》的要求和学生已有的认知能力注重实践的特点确定以下目标:

1.知识与技能

1、掌握SnagIt软件中截取部分图像、抓取窗口、抓取对象的方法。

2、能使用SnagIt软件获取屏幕图像。

3、会进行简单的图像编辑。

2.能力目标

(1)培养学生主动观察思考问题的能力、创新能力。

(2)培养学生的自主学习能力、小组协作学习能力。

3.情感目标

1、通过学生自主解决问题的过程,体会成就感,为自主学习、主动学习奠定基础。

2、通过小组协作的形式,渗透团队精神及研究探索的意识。

(三)、教学重点和难点

1.教学重点:使用SnagIt截取图像的方法。

2.教学难点:多区域、多窗口截屏操作。

二、学情分析

中等职业学校的学生的共性是对理论知识学习兴趣不高,学习比较被动,自主学习能力比较差,但对计算机这门课程还是充满好奇心,由于进校学生来源不同,刚接触应用软件不久,一般还没有真正掌握学习应用软件操作的方法,技能基础和个性差异大。本课设计的任务要顾及到学生的学习兴趣之外,更注重实用性,并对学生的技能基础和个体差异进行考虑。

三、说教法

采用了构建主义理论指导下的主体式教学模式,首先创设学习请讲,让学生在情境中主动、积极地完成任务。教师不断激发学生的学习兴趣、力求达到最佳的教学效果。创设情景——任务驱动教学法——分层教学——实践操作

四、说学法

课堂气氛“活”起来

学生“动”起来

小组之间“比”起来

展现学生的激情与活力

追踪学习法——讨论研究法——协作学习法

五、教学过程分析

本节课在多媒体教室进行,所需教具是教师机、学生机、投影仪、黑板等。学生对技能的掌握与能力的培养,还是要具体地落实到课堂教学活动的设计中。因此,在本次课的教学中,我做了如下的教学设计:

(一)组织教学:

师生问好、考勤

(二)创设情景、引入新课。

引入:同学们,我们刚刚进行了秋游,同学们都照了好多的照片。老师也照了一些,同学们给评价一下,看看怎么样?

思考:

1、照片有什么问题呢?

2、截取屏幕图像有哪些方法?

引出新知:获取屏幕图像

(三)讲授新课

根据本节教学内容以及信息技术课程的学科特点,结合学生的实际认知水平我将本节分为三个任务来完成,并把学生按5人一组进行分组。

(1)截取部分图像

任务一:通过snagit软件对给定图像进行适当的截取操作。

操作步骤:参照视频文件。

提示:截取图片的过程中应该注意,屏幕中有一个放大镜,是帮助用户精确定位和截取的。

问题:当需要截取非矩形的区域时该怎么解决呢?

试试看:对上图进行一个三角形的截取吧。

(2)抓取窗口:在SnagIt主界面中选择“窗口”选项,按下快捷键或单击“捕获”按钮,此时移动光标到需要抓取的窗口上,围绕窗口形成一个红色边框,单击即可抓取该窗口。

任务二:把下图抓取下来

(3)抓取对象:在SnagIt主界面中选择“对象”选项,按下快捷键或单击“捕获”按钮,此时移动光标到需要抓取的窗口对象上,围绕对象形成一个红色边框,单击即可抓取一个对象,例如,可以抓取窗口的标题栏、菜单栏等。

任务三:使用抓取对象抓取下图。

机动设计:静态的屏幕会截取,那么动态变化的能截取吗?

综合实践:

板报创意:在资源包任选20张图片,利用SnagIt截取等编辑完成一个板报的创意。

(四)展示与评价

评价1:各个小组推荐一名同学展示应用题目完成的结果,师生共同评价。评价2:小组之间进行相互的投票,确定优秀组。

(五)课堂小结

为了加深学生对知识的记忆、理解,我对本节课中重、难点以及学生在学习过程

中所遇到的普遍性问题做以简单的总结,并鼓励学生多进行实践操作,更多的运用多媒体技术。

(六)布置作业

作业1:上网查找关于西藏旅游的相关网页,并将其截屏,编辑自己的名字上传QQ群。

作业2:通过网络自主学习使用snagit完成屏幕录制,并上传至空间。

6.1.2获取屏幕图像

一、获取屏幕图像的方法

二、SnagIt软件获取屏幕图像

1、截取部分图像

2、抓取窗口

3、抓取对象

图像获取 篇5

精确自动地监测植物生长状况是自动控制植物生长环境条件的前提[1]。在实际生产中,作物长势的地面监测大多是种植人员采用目测的方法。虽然,在经验积累的基础上取得了一定的效果,但人的肉眼分辨能力有限,往往肉眼可以识别时,作物的伤害已比较严重[2]。数字图像处理技术在作物生产和科研的信息采集方面具有信息量大、速度快、精度高等显著的特点和优势,可避免传统方法中由于人与人之间的认识差异及视觉疲劳带来的影响,在节约劳动力,降低人的判断主观性方面有很大的潜力[3]。

目前,计算机视觉技术在作物检测方面主要应用于土壤和杂草等背景的识别、叶面积和株高测量、叶片的形态识别、作物营养信息监测等4个方面。当前对作物长势研究的方法,已从简单的形状研究逐渐发展到用颜色进行作物长势形态指标分析,从简单的通过叶面积做长势判断逐渐发展到做营养缺素特征方面的研究[4]。因此,对图像质量和图像获取的实时性要求也越来越高。然而,目前对于图像获取技术与方法的研究甚少。宋亚杰等(2006)[5]和谢守勇(2008)等[6]都是在日光条件下获取的金莲花叶片图像,然后分别提取RGB三色分量和它们的相对系数rgb以及色度H进行分析,得出了与缺水时间的关系。他们采用的图像获取方法分别是400万像素的数码相机和600万像素数码相机在现场自然光照及目距的条件下完成,而作物图像远程实时获取方法研究还未见报道。本文提出了建立作物数字图像远程实时获取系统,对图像获取设备、设备的安装形式、系统信息传输方式和远程控制管理进行了研究。

1 作物数字图像远程实时获取系统

1.1 系统组成

系统典型结构如图1所示。该系统主要包括图像获取设备、下位机、数据传输、Web服务器和客户端等部分。图1中实线表示图像信息数据流,虚线表示控制流。

1.2 系统功能

作物数字图像信息远程获取系统提供一个能够实时远程监控并记录作物生长数字图像信息的平台,为试验研究工作提供便利。利用该系统及配套软件可实现远程控制镜头、远程控制相机拍摄、图像传输、图像信息网络发布共享和图像信息分析等。甚至可以在系统分析后做出灌溉、施肥、喷药和除草等决策,控制相应设备进行该项操作,实现管理功能。其主要包括4个功能模块:用户管理与系统维护模块、数据库管理模块、图像获取与设备控制模块和数据处理与发布模块。

2 图像获取设备

2.1 普通数码相机

近年来各数码相机生产厂商纷纷开发出可以通过USB接口或IEEE1394接口连接计算机并在相应计算机软件上直接控制数码相机拍照的数码相机和软件。数码相机和计算机之间的连线USB2.0输出,数据传输5m,加延长器可达20m,IEEE1394输出,数据传输10m,加中继可达40m,传输距离较短,适用范围有限。尼康公司2007年发布了无线传送器WT-4套件,当WT-4与支持的机型连接时,它会允许图片通过无线连接与以太网线连接的个人计算机中,或者是允许图片传送到FTP服务器中,可使用远程控制软件实现对影像的传输和对相机的远程控制,如预览功能“live View”(LCD即时取景)功能以及优化调节系统,很好地解决了传输距离和布线的问题,可作为作物图像获取设备。

但是采用普通数码相机应用于作物图像自动获取有如下缺点:不能实现对镜头的变焦控制,只适用于固定目距的情况下;数码相机到计算机之间的距离仍然受限,仅个别品牌的单反相机支持无线传输,价格昂贵;普通数码相机长时间应用于农田或温室温度湿度环境中的适应性有待考量。

2.2 工业相机

工业相机又俗称摄像机,相比于传统的民用摄像机而言,它具有高的图像稳定性、高传输能力和高抗干扰能力等,目前市面上工业相机大多是基于CCD(Charge Coupled Device)或CMOS(Complementary Metal Oxide Semiconductor)芯片的相机。工业相机通过选择安装电动变焦镜头来实现对镜头的控制。其中,模拟工业相机采用视频输出,需要通过图像采集卡连接到计算机,通信采用RS-485串行通信协议,组成作物生长状况监测系统。数字工业相机输出方式主要有USB接口、IEEE1394接口和以太网输出,可以直接连接到计算机,组成作物生长状况监测系统。

USB接口、IEEE1394接口的工业相机传输距离短,加中继传输距离也分别只有20m和40m,因此应用范围受限。市面上高分辨率以太网工业数字摄像机以其图像质量高,颜色还原性好,以网络作为输出,解决了其它数字相机传输距离短的问题,传输距离长,信号稳定,CPU 资源占用少的特点成为用户的首要选择。

3 图像获取设备的安装形式

3.1 移动车载

移动车式作物图像获取设备安装,如图2所示。为方便田间作业,图像获取设备和下位机安放在特制的移动车上,下位机连接到无线以太网,客户端可远程控制小车的移动和作物图像的获取。这种方法适用范围广,应用灵活,可用于农田和温室中各种旱地场合;但是需要根据不同的作物设计或调整图像获取设备高度和轮距,监控小车的移动轨迹还要借助前视镜头,以获得更大的视野。

3.2 固定形式

固定作物图像获取设备安装,如图3所示。此方式安装布置简单,但是由于图像获取设备固定,只能获取特定植株特定角度固定目距下的图像,可同时采用多台图像获取设备以获取作物不同角度的图像,成本提高了,但适用于对特定植株的监测。

3.3 滑动导轨

有导轨作物图像获取设备安装,如图4所示。在作物上方架设导轨,安放图像获取设备。为了方便布线,可采用无线传输方式与计算机相连。由于图像获取设备与作物之间距离固定,可以采用带无线远程传输和控制功能的数码相机;也可以采用无线网络工业相机免去繁琐的布线,配以相应的电动伸缩镜头使系统更加灵活,方便关注特定叶片。该方案需要根据不同的作物间距设计相应的导轨,实现对图像获取设备在导轨上移动的坐标控制,方便获取不同植株的图像信息。

操作者只需在计算机软件上给出相应的移动坐标,等待图像获取设备到达指定作物上方位置点击获取每株作物冠层的图像信息,操作简单。其缺点是系统要根据具体情况设计开发,周期较长,对角度倾斜的叶子不能调节图像获取设备的角度。

农田中可以架设导轨,但是成本相比较高,需要架设很多支撑导轨的柱子,因此该形式更适用于温室中,可充分利用温室的墙和顶架设导轨。

3.4 云台

有云台的图像获取设备安装,如图5所示。该系统借助可旋转的云台和电动伸缩镜头实现对不同株作物的图像获取。图像获取设备安装在杆子上,用户可根据具体应用情况选择相机并配以相应接口形式、视场角和焦距的电动伸缩镜头,并根据实际距离选择不同的工业相机接口方式与计算机相连;可选择全方位智能控制云台,由于作物图像获取不拍摄移动的物体旋转速度没必要选择过快,pan:6°/s,tilt:4°/s左右就可以了。带防雨罩的云台适用于室外,同时需要设置避雷装置。

与架设导轨相比,该方案成本和系统设计开发周期上占优势,但该系统不能直接获取植株正上方冠层图像信息。

3.5 综合形式

同时采用导轨和云台可使图像获取的角度更多,方便得到不同植株、不同叶片各方向的图像,兼有滑动导轨和云台的优点。但是设备安装及设备位置控制较复杂,系统设计开发周期长,成本也较高。

4 图像信息的传输

图像信息从图像获取设备到下位机的数据传输可分为有线和无线两种方式。根据图像获取设备不同的接口形式采用不同的连接线,USB数据线、IEEE1394数据线、双绞线、光纤等。前两者传输距离很短,若数据线过长,干扰加大,传输不稳定,仅适用与图像传输设备与下位机距离很近的条件下。双绞线分不同的类,抗衰减能力和价格成正比。光纤传输距离长,抗干扰能力强,损耗低,工作可靠,但成本较高。若需要的传输距离双绞线能达到则选择双绞线,无法实现再考虑光纤。温室里或无线网络易覆盖的农田中,图像信息可直接通过无线网络传送到与以太网连接的下位机上。加入微波无线传输模块的图像获取系统,如图6 所示。图像获取设备到下位机之间若增加微波无线传输模块,微波传输距离由几十米到几十千米,增大了传输距离,增强了布线的灵活性;但成本较高,适用于图像采集地点到下位机间距离很远,布线不方便的农田中。

从下位机到Web服务器再到客户端均采用Internet网络连接。图像信息可通过网络经由Web服务器传输到用户计算机中。

图像信息数据庞大,为保证图像的流畅传输,有以下要考虑的因素:网络带宽,网络运营商提供不同的带宽(如2M,4M,8M等)包月、包年服务,用户根据实际情况选择;如果是由多个图像获取设备组成的系统,要考虑每个设备单独占用一条网络传输通道。为了方便远程访问可以选择申请付费动态域名解析软件账户或为系统购买固定IP地址,解决采用免费动态域名解析造成的系统网络连接不稳定的情况,其中购买固定IP成本较高;采用视频数据编码压缩技术,目前最热门的是H.264,具有很高的数据压缩比率。

5 作物图像数据库

建立作物图像数据库便于对作物图像的管理。数据库中图像数据的存取主要有间接存取法和直接存取法两种方法。间接存取法在数据库表中只反映图像数据文件的存储路径, 图像数据以文件形式存放于指定的计算机目录下。这种方法操作简单,但是图像数据和数据库分离,若图像数据文件更名或丢失,数据库中的图片数据将与实际存在的图片数据不一致,存在数据安全方面的隐患,因此选择直接存取法。直接存取法直接将图像数据存储在数据库关系表中,是目前图像数据库技术发展的主流, 不仅可以保证图像数据的一致性和安全性, 还可以提高图像数据的可用性和可伸缩性。由于图像数据量很大,可以利用BLOB 数据类型来实现图像数据的存储。BLOB是非常巨大的不定的二进制或者字符型数据,通常是文档(.txt,.doc)和图片(.jpeg,.gif,.bmp),可以存储在数据库中。

6 图像信息发布和远程管理

作物图像信息利用Web信息系统发布到网页上,实现作物图像信息的共享。获得浏览权限的普通用户可以浏览网页、检索图像和下载图像信息,超级用户还可以控制图像采集设备移动和拍摄,实时获取图像,系统管理员对系统进行管理和维护。功能上还可以增加图像处理以及后续控制管理到该系统中,对作物图像信息进行处理,获得作物缺素情况,发出指令控制田间相应设备灌溉施肥。

Web信息系统采用基于Internet/Intranet的标准协议和技术,采用浏览器/服务器的计算模式B/S结构[7]。客户端是标准的浏览器,接收用户的请求并传递给Web服务器,Web 服务器根据HTTP协议接收并处理浏览器的各种请求,同时将数据请求通过数据库接口程序送到数据库服务器,数据库服务器根据数据请求执行相应的数据库操作(如查询、修改、统计等),并将结果通过数据库接口程序送回Web 服务器,Web服务器将结果送回Web浏览器。

传统的信息系统一般采用客户机/服务器(C/S)模式。 该模式虽然充分发挥服务器的能力,安全性好,但同时也导致系统开发和维护的繁琐,且容易造成网络瓶颈。

7 结论

本文研究了作物数字图像远程实时获取系统的组成和功能。硬件组成包括图像获取设备、下位机、数据传输、Web服务器、客户端等部分。功能模块包括用户管理与系统维护模块、数据库管理模块、图像获取与设备控制模块和数据处理与发布模块。

研究指出利用带无线传输功能的数码相机和高清晰网络工业相机可作为作物数字图像获取设备。给出了图像获取设备的5种安装形式:移动车载、固定形式、滑动导轨、云台和综合形式。

指出图像信息从图像获取设备到下位机的数据传输可采用有线或无线的两种方式,有线传输速度快,但受传输距离和布线环境条件的限制。微波无线传输方式可以避免有线传输的缺点,显著增大了传输距离。从下位机到Web服务器再到客户端采用Internet网络连接。

由于图像数据庞大应考虑网络带宽,单个图像获取设备独享一条网络通道时,可以显著增加图像信息的传输速度。为了实现远程访问,可以选择购买动态域名解析软件帐户或固定IP地址;提出利用直接存取法建立作物图像数据库和利用Web信息系统实时发布作物图像信息和设备远程控制管理的方案。

摘要:作物图像获取方法是应用计算机视觉技术监测作物长势的首要问题。为此,对作物数字图像远程实时获取方法进行了研究。研究的作物数字图像远程实时获取系统由图像获取设备、下位机、数据传输系统、Web服务器和客户端等部分组成,包括用户管理与系统维护、数据库管理、图像获取与设备控制和数据处理与发布4个功能模块。系统利用带无线传输功能的数码相机和高清晰网络工业相机作为作物数字图像获取设备,并给出了图像获取设备的5种安装形式:移动车载、固定形式、滑动导轨、云台和综合形式;系统在图像获取设备到下位机之间采用有线或微波无线的传输方式,从下位机到Web服务器再到客户端采用Internet网络连接,通过增加带宽可以显著提高图像信息的传输速率;系统利用直接存取法建立作物图像数据库,并利用Web信息系统实现了作物图像信息的实时发布。

关键词:计算机视觉技术,数字图像,图像获取,农业

参考文献

[1]王方永,王克如,王崇桃,等.基于图像识别的棉花水分状况诊断研究[J].石河子大学学报,2007,25(4):404.

[2]刘保玲,姚彪,史春建,等.近红外图像处理技术在国外农业工程中的应用[J].农业工程学报,2005,5(21):102-106.

[3]刘继承.基于数字图像处理技术的水稻长势监测研究[D].南京:南京农业大学,2007.

[4]李民赞,光谱分析技术及其应用[M].北京:科学出版社,2006:388.

[5]宋亚杰,谢守勇.机器视觉技术在金莲花灌溉中的应用研究[J].西南农业大学学报(自然科学版),2006,28(4):659-662.

[6]谢守勇,宋亚杰.金莲花生长发育需水模糊评判模型研究[J].农业工程学报,2008,24(1):64-67.

农田蛾类图像边界特征的获取 篇6

长期以来,我国对农田虫害的预测预报多沿用黑光灯诱集昆虫和人工识别计数的测报方法。该方法与测报人员的综合素质密切相关,主观因素较大,影响了测报的准确性和时效性。为此,我国对于农田虫害的自动分类识别与虫害的自动预测预报展开了一系列的研究。沈佐锐等利用图像识别技术,提取昆虫图像的周长、面积和偏心率等,然后对昆虫进行分类识别[1];邱道尹等设计了能够自行调整昆虫姿态的装置,并使用神经网络对提取的昆虫图片进行分类识别[2]。国外学者也进行了这方面的研究,Tara Weaver-Missick开发了能准确识别和自动捕捉鼻涕虫的机器人[3];Watson A T等采用灰度图像,对35种常见的鳞翅昆虫进行了识别研究[4];Gassoumi H等利用计算机视觉来实现棉花虫害的分类[5]。这些研究取得了一定的成果,但是要应用在实际生产过程中,还有许多的困难要克服。本文是在邱道尹等人研究成果的基础上,进一步对农田蛾类的边界特征进行研究,介绍了农田蛾类边界特征的获取方法,对几种常见的农田蛾类边界特征进行比较,得出边界特征可以作为农田蛾类分类识别的一个重要依据的结论。

1 图像预处理及目标分割1.1 图像获取及预处理

图像获取是整个农田蛾类分类识别的基础,图像质量的好坏影响到农田蛾类分类准确率的高低。在图像获取时,采用JVC公司生产的高清晰度昼夜型摄影机。此摄像机具有535线高清晰的水平分辨率,像素值为44万像素。在获取图像过程中,为了保证摄像机能够获取质量较好的图像,在摄像机照射区域的周围布置了4盏能够发黄色光的白炽灯,保证了光照的均匀,又不会因为光照过强而影响图像的正常获取。本文所有农田蛾类图像均于实验室中在上述环境下获取的。

从摄像机获取的蛾类图像是彩色图像,其数据量大,占用内存大,处理速度慢,没办法满足图像实时处理的要求。为了提高图像处理的速度和实用性,首先把彩色图像转化为灰度图像。实现彩色图像到灰度图像转换的计算公式为

I=0.3R+0.59G+0.11B (1)

式中 I—转换后的灰度图像的亮度值;

R,G,B—原图像的红、绿、蓝颜色分量。

原始图像由于摄像机自身噪声或光照不均匀的污染,会在灰度图像上出现噪声点或噪声块,对后阶段的处理带来不利影响。为此,采用直方图均衡来解决因光照不均而引起的噪声块的问题,采用5×5的均值滤波器来消除噪声点问题。图1是经过图像预处理后得到的灰度图像,图中的蛾类依次为豆田蛾、金龟子、地老虎和蝼蛄。

1.2 图像分割

在经过预处理后,需要对得到的灰度图像进行图像分割,得到蛾类昆虫的目标区域。目标分割的方法很多,常用的有全局阈值分割法、动态阈值分割法、区域生长和区域合并等。本文选用Otsu方法来进行目标分割。Otsu方法又称为最大类间方差方法,它通过自动寻找图像分割的门限值,使图像上灰度不同的像素之间方差达到最大值[6]。 Otsu方法不需要进行递归操作,实现速度快,算法结构简单,具体过程如下:

1)假设图像中的所有可能灰度级数为L,图像中像素总数为n,灰度级为rq的像素数目是nq,初始选定一个阈值k,C0是一组灰度级为[0,1,…,k-1]的像素,C1是一组灰度级为[k,k+1,…mL-1]的像素。Otsu方法就是选择最大化类间方差σB2的阈值k,类间方差定义式为

σB2=ω0(μ0-μT)2+ω1(μ1-μT)2 (2)

其中,ω0=q=0k-1pq(rq)ω1=q=kL-1pq(rq)μ0=q=0k-1qpq(rq)/ω0μ1=q=kL-1qpq(rq)/ω1μΤ=q=0L-1qpq(rq)pq(rq)=nqnq=012L-1

以上计算过程是Otsu方法自动选取阈值的过程。图2是豆田蛾、金龟子、地老虎和蝼蛄4种昆虫经过Otsu方法进行目标分割后的图像。从分割结果来看,目标区域被分割为黑色区域,背景区域被分割为白色区域。但由于光照不均和昆虫本身颜色明亮程度的不同,把一部分背景区域分割成了假目标区域,如图2(a)中的右上角和右下角的黑色区域;同时也把一部分目标区域分割成了背景区域,如图2(a)和图2(b)中目标区域内部的白色区域。这些错分结果需要进行处理后才能进行下一步工作。

2 对分割图像的处理

在得到分割后的黑白二值图像后,需要对二值图像进行进一步处理,去除假目标区域如图2(a)的右上角和右下角;填充目标区域如图2(a)和图2(b)中目标区域所包围的背景区域。首先,对目标区域进行填充,把目标区域内的背景填充为目标区域。从图2可以看出,假目标区域的面积相对较小,且假目标区域主要处于图像的边界上,其目标区边界线比较笔直,可以通过计算黑色区域的面积、长宽比和边界的弯曲度把这些假目标区域排除掉,处理的结果如图3所示。

在图3中,为了处理方便,把目标区域由图2的黑色取反变成白色,同时把背景区域取反变成黑色。对比图3和图2可以得到,目标区域已被完整填充,假目标区域也被消除。但同时也注意到,图3(d)中的蝼蛄进行目标区域的填充后,把一部分背景区域变成了目标区域,由于最后想要获取的是目标区域的边界特征,增加的这部分目标区域处于边界的内部,不会对边界特征造成影响,不用把这部分区域去除掉。

3 目标边界特征的获取

从图3可以看出,各种昆虫的边界形状各不相同,在对昆虫图像进行分类识别时,可以充分利用这一信息。但是,在获取目标边界特征时,存在以下两个困难之处:一是如何选取适合的方法来表示边界特征;二是同一种蛾类昆虫的不同图像之间,目标区域存在一定的旋转角度,在提取边界特征时,应该消除由于旋转角度的存在而对边界特征获取的影响。

3.1 边界特征的表示

为解决问题1,本文以目标区域边界点到目标区域质心点的距离作为边界特征的表示。目标区域质心点的计算公式为

i¯=m10m00=i=1nj=1mif(i,j)/i=1nj=1mf(i,j)j¯=m01m00i=1nj=1mjf(i,j)/i=1nj=1mf(i,j)(3)

图4(b)依次给出了豆田蛾、金龟子、地老虎和蝼蛄4类昆虫的质心点位置,目标区域中的蓝色点为质心点。

3.2 目标区域旋转变换

对于问题(2),同一种蛾类的每个昆虫在图像中 的目标区域旋转角度是各不相同的,必然导致同一种 蛾类的每个昆虫目标区域质心点坐标各不相同,以及同一种蛾类昆虫中每个昆虫的目标区域形成的边界特征各不相同,没办法对蛾类昆虫进行分类识别。为此,需要将各种蛾类昆虫的目标区域进行旋转变换,使同一种蛾类昆虫的目标区域朝向相同。本文采用以下方法来解决昆虫目标区域旋转的问题:

1)确定每个昆虫的目标区域外边框;

2)计算目标区域(包括边界点)所有像素点之间的距离,得到距离最远的两点A点和B点;

3)计算AB两点之间的直线LX轴的夹角θ;

4)以θ角为旋转角度,旋转目标区域即可。

图4显示了对4个豆田蛾昆虫目标区域的旋转变换,图4(a)为不同朝向的4个豆田蛾昆虫图像,图4(b)是旋转变换的结果。在图4(b)中,用蓝色圆标记出了旋转变换后目标区域的质心点。由此可以看出,旋转变换后豆田蛾的目标区域方向是两个相反的方向。虽然存在两个相反的方向,但从图4(c)可以看出,这两个方向上所获取的边界特征是相同的,从而不再需要进一步旋转变换为同一方向。

图4(c)是图4(b)按边界特征的获取方法或获取的边界特征数据。在图4(c)中,曲线的高度代表了边界点到质心点的距离,曲线的起始点以边界点到质心点距离最远的点为起始,然后按顺时针方向依次计算每个边界点到质心点距离,把这些边界点到质心点的距离作为曲线的高度表示。从图4(c)可知,同一种类的蛾类图像的边界特征基本上是相同的。

图5给出了不同种类不同朝向的昆虫经过旋转变换后得到的边界特征。从图5可以看出,不同种类的昆虫其边界特征数据也大不相同。这些边界特征数据可以作为后面昆虫分类识别的数据依据。


4 结束语

首先,介绍了昆虫图像预处理方法;然后,利用Otus方法来对昆虫图片进行分割,对分割后的图像再进行各种处理,消除对边界特征获取的影响因素。对处理后的分割图像按旋转规则进行旋转变换,对旋转变换后的图像按边界特征提取规则,计算其质心点和边界特征。从所得的结果来看,不同种类的蛾类昆虫的边界特征各不相同,可以把边界特征作为下一步昆虫自动分类识别的重要数据支持。

摘要:介绍了农田蛾类图像的预处理方法,然后使用Otsu方法来对农田蛾类图像进行分割。对分割得到的目标区域采取旋转变换,使同一种蛾类的目标区域具有相同方向;对旋转变换得到的蛾类图像目标区域,以目标区域的边界点到目标区域的质心点距离作为目标区域的边界特征,获取各种蛾类图像的边界特征。从所获取的边界特征可知,不同种类的蛾类图像具有各不相同的边界特征,可以把这些边界特征作为各种蛾类昆虫分类识别的数据依据。

关键词:蛾类,图像分割,边界特征获取,分类识别

参考文献

[1]邱道尹,张红涛,刘新宇,等.基于机器视觉的大田害虫检测系统[J].农业机械学报,2007,38(1):120-122.

[2]于新文,沈佐锐,高灵旺,等.昆虫图像几何形状特征的提取技术研究[J].中国农业大学学报,2003,8(3):47-50.

[3]Tara Weaver-Missick.Listening to larvae[J].AgriculturalResearch,2001,49(3):21.

[4]Watson A T,Mark A O'Neill,Kitching I J.Automated iden-tification of live moths(Macrolepidoptera)using digital auto-mated identification system(DAISY)[J].Systematics andBiodiversity,2003,1(3):287-300.

[5]Gassoumi H,Prasad N R,Ellington J J,et al.A neuro-fuzzy approach for insect classification[C]//Maui,Hawaii:World Automation Congress,Third International Symposiumon Soft Computing for Industry,2000.

[6]Otsu N.A threshold selection method from gray-level his-to-grams[J].IEEE Transactions on Systems,Man,and Cybernetics,1979,9(1):919-926.

[7]于新文,沈佐锐.昆虫数字图像的分割技术研究[J].农业工程学报,2001,17(3):137-141.

图像获取 篇7

目前, 行人-车辆交通事故是导致行人死亡的主要因素之一。有关研究表明, 左转车辆最容易对行人造成伤害, 其事故是右转车辆与行人事故的4倍。2003年行人交通引发交通事故造成25 673人死亡、68 040人受伤, 分别占总数的24.6%和13.8%。由于行人在交通事中常常处于弱势地位, 一旦与机动车发生交通事故很容易受到伤害。为减少行人与车辆伤害事故发生, 在智能交通领域运用传感技术对行人进行检测, 并及时将行人信息传送给驾驶员, 提醒驾驶员前方有行人, 注意减速或者停车, 以免与行人发生碰撞, 造成伤亡[1,2,3,4]。

利用单目视觉系统采集的图像信息, 基于行人横道线特征, 采用动态阈值法将横道线和其他部分进行自动分类, 利用横道线边缘点拟合出横道线边界线以建立识别感兴趣区, 以人行横道线边界曲线方程作为计算约束, 由行人在图像中的像素坐标值可以确定行人处在哪2条边界线区间及区间中的哪条曲线上, 从而基本知道行人在实际路面坐标中的区间范围并求解出实际位置, 从而在连续序列图像中实现行人实时、可靠的交通参数 (位置、速度) 的获取。

1 人行横道线图像分割

Otsu阈值分割方法是从最小二乘法原理的基础上推导出来的, 其基本思路是基于图像的直方图, 某一灰度为阈值将图像分成2组并计算2组的方差, 当2组之间的方差最大时, 就以这个灰度值为阈值进行图像的阈值分割, 同时认为图像不同类间的分离性最好。设1幅图像的灰度值为L个, 灰度值为i, 然后用k值将其分成2组C1={1~ (k}, C2={k+1~ (L}, 则C1组和C2组的方差分别为[5,6]

式中:μ1, μ2分别为C1, C2组的平均灰度值;pi为各灰度值的概率;ω1, ω2分别为C1, C2组出现的概率;

2组之间的方差为

式中:μ为整体平均灰度值;σ2为阈值选择函数, 当k从1~L之间变化, 最大值时的k值就是阈值。

交叉口人行横道线灰度图像可以采用上述方法以一合适的阈值将图像像素分为横道线部分和其他部分, 分割前后的图像见图1。

2 识别感兴趣区建立

由于研究对象是在行人横道线上的行人, 图像中目标搜索区域也可由整帧图像缩小为由横道线特征点拟合出的横道线边界曲线vil、vir组成的区域, 称为行人识别感兴趣区, 如图2、图3 (黑色边界线间包括的区域) 所示。建立感兴趣区域有利于缩短检测横道线内行人所需的时间。

边界曲线方程分别表示为

式中:kl, kr分别为两边界曲线斜率;bl, br分别为两边界曲线截距。

3 行人检测

研究对象界定为在人行横道线范围内行走的行人, 且认为行人始终在人行横道线内行走。行人检测方法采用的是简单、有效的背景差分法[7]。在建立感兴趣区后, 背景差分法进行行人目标检测主要还包括以下几个步骤:背景模型构建、行人目标检测和背景更新。

1) 背景模型构建。背景建模有许多种方法, 如帧差法、帧均值和中值法、帧加权平均法、混合高斯模型法等, 考虑到算法实现的简单性和整体性能 (识别速度、内存需求、目标检测的精确性等) , 帧均值和中值法效果较好, 也是用得最多的背景模型构建方法[8]。其基本思想是通过视频采集系统获取L张视频帧, 求出这L张视频帧同位置像素值的平均值或中值作为背景图像中该位置像素值。笔者用帧均值法建立行人检测背景模型, 用公式表示为

式中:BL为L张视频帧同位置像素值的平均值;Ii (un, vn) 为在行人识别感兴趣区内, 第i张视频帧第n个像素, 坐标为 (un, vn) 的像素点的灰度值。

由此, 得到行人检测背景模型, 见图4。

2) 背景更新。艾海舟提出了动态背景更新的方法[7]。如果具体到交叉口行人图像, 背景更新时, 在感兴趣区域内自上而下扫描图像, 计算目标图像与初始背景每1行像素点的水平投影值, 两者平均值的差如果在设定的阈值范围内没有突变行, 则将此区域作为新的背景区域。在更新过程中, 如果初始检测区有突变, 而横道线特征区没有, 则先对横道线特征区进行更新再对初始检测区进行更新。

3) 行人目标检测。对交叉口人行横道线内行人的检测采取了2个步骤:行人的分割和行人的识别[9]。背景图像形成以后, 将输入的1帧图像 (当前帧) 与背景图像进行比较并对当前帧中的行人目标进行分割。由于同位置像素值间存在一定程度的差别, 进一步对这些像素点进行处理 (包括选择合适的阈值进行二值化) , 就可以得到目标的形状、大小、位置等信息, 再根据行人本身所表现出来的特征最终判断出分割出来的区域是否为行人。见图5。

对于分割图像, 由左向右同时由右向左进行扫描, 如果连续3列且每列垂直投影值都大于等于1, 记下目标所在图像的列号并计算出列宽。再对分割图像自上而下同时自下而上进行水平扫描求取水平投影值, 如果连续3行且每行水平投影值都大于等于1, 记下目标所在图像的行号并计算出行宽。如果是行人, 则行宽与列宽之比应在普通行人的高宽比范围内, 这样就可以确定行人的存在, 并记录下行人所处图像的行号和列号。

不同帧行人检测结果见图6。

4 过街行人位置确定

基于行人识别感兴趣区, 以人行横道线特征 (见图7) 作为计算约束, 可以求得行人过街位置坐标。

在图像平面中, 第m条横道线上边界的曲线方程表示为

相邻的下边界的曲线方程表示为

式中:km、km+1为直线斜率, 并且km=km+1;bm、bm+1为直线截距。

正常情况下, 应保证图像中的横道线与图像纵坐标相互垂直, 即km=0, 如果斜率km≠0, 则主要是由微小误差引起的。通常情况下, 人行横道线会在路面上长期存在并且每1条人行横道线具有一定的宽度, 《道路交通标志和标线》 (GB5758.3—2009) 中规定:人行横道线的线宽为40cm或45cm, 线间隔一般为60cm。笔者对每条横道线上、下边界均建立曲线方程, 设共有no条横道线在图像中, 则有2no条边界曲线, 如果某1条横道线间有行像素点 (不包括边界线) , 则此条横道线间有条曲线方程, 这样, 由行人在图像中的像素坐标值可以确定行人处在哪两条边界线区间 (对于处在横道线外的区域也可由相邻2条边界曲线确定) 及区间中的哪条曲线上, 从而获得行人在实际路面坐标中的区间范围并确定出行人的实际位置。

5 试验验证

横道线内行人被检测到后, 将在若干帧序列图像中连续存在, 其在图像中的位置也有一定的连续性, 其特征有很大的相关性。利用序列图像的这些特性, 对目标行人进行实时跟踪, 将识别后的行人最前端 (即脚部) 的像素坐标代入曲线公式中可求出行人实际路面位置。分别求解出2帧行人图像在实际路面中的坐标值就可以得到实际的行走距离, 距离除以2帧图像之间的时间差便可以得到行人行走的速度。在试验验证过程中, 所选CCD摄像机其图像采集速度最高可达到50帧/s。试验结果 (见表1) 表明, 算法的可靠性和实时性较好。

6 结束语

为提高城市道路交叉口过街行人的交通安全水平, 减少单目视觉技术测距与实际情况间的误差, 研究中充分利用人行横道线本身所具有的特征, 提出了交叉口人行横道线特征自动提取、识别, 以及行人交通参数获取方法, 可以有效地识别行人和确定行人在交叉口的位置、行进速度。下一步主要工作是针对复杂环境的交叉口或路段多行人的交通参数获取方法研究。

参考文献

[1]郭烈, 王荣本, 顾柏园, 等.世界智能车辆行人检测技术综述[J].公路交通科技, 2005, 22 (11) :133-137.

[2]Grubb G, Zelinsky A, Nilsson L, et al.3Dvision sensing for improved pedestrian safety[C]∥Parma:IEEE Intelligent Vehicles Symposium, 2004:19-24.

[3]裴玉龙, 程坦.城市道路平面信号交叉口行人安全分析[J].交通信息与安全, 2008, 27 (3) :105-107.

[4]Pai Chiajung, Tyant Hsiaorong.Pedestrian detection and tracking at crossroads[C]∥Shanghai:IEEE Intelligent Transportation Systems Conference, 2003:101-104.

[5]齐正罡.基于统计特征的AGV特殊标识符识别方法研究[D].长春:吉林大学, 2005.

[6]王荣本, 徐友春.基于线性模型的导航路径图像检测算法研究[J].公路交通科技, 2001, 18 (2) :47-51.

[7]艾海舟, 乐秀宇.面向视觉监视实时跟踪的动态背景更新方法[J].计算机工程与应用, 2001 (19) :104-106.

[8]代科学, 李国辉.监控视频运动目标检测减背景技术的研究现状和展望[J].中国图象图形学报, 2006, 11 (7) :919-926.

图像获取 篇8

1 脉象传感器工作原理

传感器结构如图1所示。采集数据时首先向密封腔内充气,使软性薄膜微微鼓起,被试者手腕放置于所示位置16,使手腕桡动脉与软性网格薄膜15接触,调节加压螺钉1至适当切脉压力,用CCD摄像头9采集动态图像送至计算机8进行后期处理。

1、加压螺钉;2、可滑动水平支架;3、紧固螺钉;4、板弹簧(弹性钢板);5、立柱;6、底座;7、手动气泵;8、计算机;9、CCD摄像头;10、玻璃挡片;11、气路;12、照明光源;13、压力密封腔;14、环形塑料片;15、软性薄膜(绘有网格图案);16、手腕放置区域;17、手腕垫衬;18、压力指示计;19、气压缓冲腔。

2 脉搏信息获取方法

2.1 图像离面位移获取算法

物体通过透镜成像,成像大小随物距而变[5],其原理如图2所示。图中L表示成像透镜,透镜右边表示实物,左边表示实物在成像平面所成的像。图中实线部分表示初始大物距成像过程,虚线部分表示物距变小后的成像过程。图中a为像距,b为初始物距,d表示物距变化量,h和v分别表示实物高、宽的一半,N、M分别是大物距时h、v对应的图像值,H、V分别是小物距时h、v对应的图像值。

图2中,根据三角形相似原理可得:

从式(11)中,根据图像网格面积可计算出物距的变化量,此变化量反映了脉管径向离面位移变化,很显然该位移与四边形面积相对变化量成正比。

2.2 Harris角点检测与跟踪算法

角点检测就是检测图像中曲线的一些拐点,比如长方形的四个顶点,最直观的就是在水平、竖直两个方向上变化均较大的点。Harris角点检测算法是基于图像灰度的角点检测算法[6,7],具有很好的定位性能和鲁棒性[8]。它通过计算像素所在位置灰度的梯度检测角点,如果像素所在位置两个方向灰度梯度的绝对值都比较大,则判定该像素位置为角点。

Harris算子:

其中

Iu(x,y),Iv(x,y)和Iuv(x,y)分别为图像点(x,y)处的灰度在u和v方向的偏导数以及二阶混合偏导数,k为经验值取0.06。如果R超过某一阈值,即认为该点为角点。

本文帧间对应角点的跟踪采用最近距离方法:应用Harris角点检测算法对每帧网格图像进行处理,求取图像中的角点。各帧图像中对应角点跟踪:计算当前帧所有检测到的角点坐标与前一帧已确定角点坐标间的欧氏距离,取距离值最小时的角点为当前帧中与前一帧中已知角点的对应角点。以此类推,直到最后一帧图像。

2.3 初始物距b标定

应用图8所示装置标定初始物距b,图中摄像头通过USB口与电脑连接,将其固定于千分尺下端,标定物网格薄膜固定于支架上不动,调整千分尺便可以上下移动摄像头调整物距。当成像最清晰时(因为脉象传感器工作时初始图像最清晰),记录物距数值。为了提高精度,做5次重复实验,b取其平均值。实验数据如表1所示。计算表1中各次数据平均值,得初始物距b=11.682mm。

2.4 实验仿真

采集某人30s脉搏动态图像,共计906帧,单帧图像分辨率为640×480。摄像头使用Philips公司的CCD摄像头PCVC840K。为了提高图像中网格面积变化量的计算精度,以及克服微小旋转对处理结果产生的影响,采取以下方法处理各帧图像。

(1)用Harris角点检测算法在图像中检测角点,并将检测到的角点用红色十字标记,记录其坐标。

(2)在初始帧图像选择16个可以确定4个四边形所需的角点,以该4个四边形的对角线交点为顶点,建立新的四边形,如图3所示。

利用本文中描述的角点跟踪算法,在以后的各帧中求取对应的新四边形。

(3)新四边形面积计算

为了克服图像旋转变形对四边形面积计算的影响,采用以下方法计算面积。设图4所示四边形p1p2p3p4,a1、a2、b1、b2、c1分别是各对应边及对角线的长度。

将图4四边形p1p2p3p4面积由两个三角形Δp1p2p3和Δp1p4p3的面积之和进行计算。

Δp1p2p3面积:

其中,。

Δp1p4p3面积:

其中,

则,四边形p1p2p3p4面积为:

应用上述算法对各帧图像平面上4×6共24个四边形分别进行处理,计算其面积变化量。每组面积变化值以最小者作为参考面积s,利用式(11)计算对应各点离面位移变化量d。绘出平面24点波形如图5所示。图中各子图纵坐标表示脉搏离面位移量,单位mm;横坐标表示图像帧数。根据同一平面上24个点的位移量,对薄膜图像表面进行重构,部分重构表面如图6所示。

图6中左上、右上、左下、右下子图分别是第1、46、96、155帧网格表面的重构图,可以看出不同时刻脉搏跳动强度不同,图像表面的形状也不同,脉搏跳动强度大,表面变形大;脉搏跳动强度小,表面变形小。

3 误差分析

为了验证本文方法的精度,采用图7所示实验装置做标定实验。实验从物距为11mm开始,以0.1mm为步长向下调整物距,直到9.1mm。物距每减小0.1mm采集一帧图像,共计20帧。对这20帧图像用本文方法计算单点物距的变化量,并与实际物距的变化量进行比较,如图8所示。

对图8中曲线各点进行误差分析,误差曲线如图9所示。绝对误差平均值9.04%;相对误差平均值0.89%,说明使用本文方法从图像网格面积变化量中提取离面位移信息具有较高的精确性。

为了说明同一平面各点离面位移值与所对应四边形在平面上的位置无关,对标定实验中第20帧图像平面上3x4共12个四边形采用本文算法计算物距变化量,结果如图10所示。从图中可以看出各点值基本在同一平面上,可见本文计算离面位移的算法与四边形在平面中的位置无关,只与各四边形面积的变化量有关。

4 总结

本文根据脉搏图像传感器采集到的反映脉搏变化信息的网格状视频图像序列的特点,提出了一种从图像网格面积变化计算脉搏信息的方法。该方法不需要知道摄像机的任何内部参数,使用方便,有普遍的适用性。通过实验提取相应的脉搏波形,并对薄膜表面进行了三维重构,证明了该方法的有效性。通过标定实验进行了误差分析,表明从图像网格面积变化量中提取脉搏信息的方法具有较高的精度。

参考文献

[1]费兆馥.现代中医脉诊学.人民卫生出版社,2003

[2]燕海霞,等.中医脉象传感器的研究进展.上海中医药大学学报,2005,19(1):62-64

[3]Akimistu Harada,et al.New methods of one-point measurement of pulse wave velocity.IEEE Ultrasonics Symposium,2002:1835-1838

[4]张爱华,等.图像化脉象采集装置的研制.传感技术学报,2006,19(4):1261-1263

[5]C.J.Tay,et al.Digital image correlation for whole field out-of-plane displacement measurement using a single camera.Optics Communications,2005,251:23-36

[6]闫龙,等.图像质量对Harris角点检测的影响研究.山东大学学报(工学版),2006,36(5):21-22

[7]梁志敏,等.摄像机标定中亚像素级角点检测算法.焊接学报,2006,27(2):102-104

图像获取 篇9

精确自动地监测作物生长状况是提高农业生产管理自动化水平的前提[1]。数字图像处理技术在作物信息采集方面具有信息量大、速度快、精度高等显著的特点和优势,在节约劳动力,降低人的判断主观性方面有很大的潜力[2]。

国外自20世纪80年代起将图像处理技术应用在农业上,主要包括杂草与病虫害防治、农产品加工、田间作业机器人、作物生长状态监测和农产品品质检测及分级等方面[3,4,5]。国内本领域的研究起步较晚,近年来,国内计算机视觉技术与农业结合的理论和实践研究也有所发展,体现在作物缺素症状识别、杂草识别、作物群体结构监测等方面[6,7,8]。随着网络时代的来临,基于Internet网络的作物生长、病虫害远程监测及诊断的理论与方法,建立作物远程智能化检测与诊断系统的研究是重要的发展方向[9,10,11]。

以往研究集中在如何利用具体的图像分析技术,达到作物图像特征信息表达与识别的目标,从而应用于杂草识别、长势分析与缺素识别方面,对图像获取手段和获取系统的技术要求等论述较少。本文从建立作物图像获取系统的角度出发,分析了作物图像的颜色、分辨率、格式和文件大小,研究了常用作物图像获取及分析技术在作物监测方面的主要应用。

1 作物图像基本特征

1.1 作物图像的颜色

人的颜色感知源于不同波长的可见光对人的视觉器官的刺激。人眼的锥状细胞感受彩色,将电磁光谱的可见部分分为红绿蓝3个波段。因此,所有颜色都可看成是这3种颜色不同比例的组合[12]。

数字图像表示颜色采用二进制,图像中的每个像素都分成R,G,B等3个基色分量,每个基色分量直接决定其基色的强度。16位色的发色总数是2的16次方,即65536色。24位色被称为真彩色,每个基色占8位,它可以达到人眼分辨的极限,发色数是2的24次方,可达1677万多色。但是,32位色就并非是2的32次方的发色数,它其实也是1677万多色,只不过是增加了256阶颜色的灰度,为了方便称呼,规定它为32位色;而36位色则是24位发色数再加512阶颜色灰度。

为了科学定量地描述颜色,人们根据需要提出了各种颜色模型,比较常用的有RGB颜色模型以及HIS颜色模型[13]。

人眼的3种锥体细胞光谱吸收的峰值分别在红、绿、蓝三色光波长左右。RGB颜色模型将自然界的颜色通过选用红、绿、蓝三基色按不同比例混合而形成[14]。该模型用三维空间点来表示颜色,点的3个坐标值分别代表该点颜色的红绿蓝亮度值(0~1之间)。原点(0,0,0)对应的颜色为黑色,它的3个坐标值都为0。距离原点最远的顶点(1,1,1)对应的颜色为白色,它的3个分量值都为1。从黑到白的灰度值分布在这两个点的连线上,该线称为灰色线。立方体内其余各点对应不同的颜色。彩色立方体中有3个角对应于三基色—红(1,0,0)、绿(0,1,0)、蓝(0,0,1)。另外3个角对应于三基色的3个补色—黄色(1,1,0)、蓝绿色(0,1,1)、紫色(1,0,1)[15]。RGB模型是最基本的色彩模型,应用广泛。该模型提取方便,但是不直观,色差不能用欧氏距离来获得,不能有效地提供颜色方面的信息,颜色分离时容易造成误分离,R,G,B分量之间存在很高的相关性,而且都带有亮度信息,可能会漏掉一些有用信息或夹杂一些无用信息[18]。

HSI颜色模型基于颜色色调(Hue)、饱和度(Saturation)、亮度(Intensity)3个基本属性,可以反映人的视觉系统观察彩色的方式。饱和度表示颜色的鲜明程度,饱和度越高,颜色越深;亮度是光波作用于感受器所发生的效应,其大小由物体反射系数来决定,反射系数越大,亮度愈大。HSI色彩空间可以用一个圆锥空间模型来描述,色调与饱和度两个参数用极坐标方式表示,角度表示色调,半径表示饱和度。人的视觉系统经常采用HSI色彩空间,它比RGB色彩空间更符合人的视觉特性。在图像处理和计算机视觉中大量算法都可在HSI色彩空间中方便地使用,HIS中3分量可以分开处理,而且是相互独立的,亮度I分量与图像的彩色信息无关。因此,在HSI色彩空间可以大大简化图像分析和处理的工作量。

1.2 作物图像的分辨率

图像分辨率(Image Resolution)是指图像中存储的信息量。图像分辨率有多种衡量方法,典型的是以每英寸的像素数来衡量。图像分辨率越高,其单位面积上所包含的像素越多,图像的清晰程度和表现程度越好。图像分辨率以比例关系影响着文件的大小,文件大小与其图像分辨率的平方成正比。

贾良良在实验中研究发现,1024×768与1280×960两个图像分辨率下的标准化绿光值之间没有差异[19]。Steffen Gebhardt和 Walter Ku hbauch对不同分辨率下图像的作物识别分析结果进行了比较,结果发现:图像分辨率1704×2272效果最好,用时21.4804s;2448×3264其次,用时42.7013s,出人意料的是分辨率较低的480×640,排名第3,用时很短2.4536s[18]。可见,图像分辨率高的识别效果好,但是分析程序用时也最长,需要根据图像的各种应用的具体情况,选择合理的图像分辨率。

1.3 作物图像的格式

图像的存储对数字图像处理十分重要,应避免采用会破坏图像信息,使图像失真的存储格式。目前,常用的图像格式有BMP,TIFF,GIF和JPEG等。BMP格式图像是完全无压缩格式,各像素以二进制数字存储,因此图像文件很大,不适合用作本研究中的图像存储方式;TIFF格式是一种无损压缩方式,压缩比很小,并且即使是压缩过的图像也可以通过图像转换而进行恢复,且转换中不会丢失任何图像信息,TIFF格式的图像文体通常也较大;GIF格式适合网络图像传输,图像压缩比非常大,不适合用作图像处理;JPEG格式是压缩图像格式,它将图像信息中的一些不必要的信息进行了压缩,因此在图像转换中会有部分的图像信息丢失,且丢失的信息不可以恢复,但JPEG格式压缩比可以很高,图像文件可以很小。

贾良良在试验中比较了TIFF和JPEG两种图像格式是否会影响到RGB图像的处理结果[17]。图像格式对冠层绿色深度G/(R+G+B)没有影响,在高施氮、优化施氮和不施氮3个处理上都没有差异,且所不同图像处理结果之间的标准差和变异系数相差不大。因此,可以用JPEG格式来存储图像,节省大量的图像存储空间。

1.4 作物图像文件的大小

影响作物图像文件占用空间的因素有作物图像的分辨率、作物图像的格式及图像压缩率。色彩越复杂的图像压缩率越低。未压缩图片计算公式为(单位:MB)

FS=LR×VR×CB/8/(1024×1024)

式中 FS—图像文件大小;

LS—横向分辨率(lateral resolution);

VS—纵向分辨率(vertical resolution);

CB—颜色位数(color bits)。

例如,图像分辨率为1920×1080,24位真彩色,未压缩前的大小为1920×1080×24/8/(1024×1024)=5.93(MB)。而同样的作物图片以JPG格式存储,大小为100kB左右,压缩率达到40倍以上。

2 作物图像信息分析方法

目前,研究者所提取的作物图像特征以颜色特征居多,也有人使用纹理或形状等特征。大部分研究者都采用相关分析技术分析所提取的特征与作物营养状况或病虫害情况之间的密切程度。综合采用不同图像处理技术方面,利用作物图像颜色、纹理和形态等特征参数,可使作物图像分析更加科学系统。

2.1 作物图像颜色特征

近年来,基于作物图像信息的作物科学研究普遍采用24位真彩色或32位真彩色图像。大多数是获取作物图像的R,G,BH,S,I颜色值,并对R,G,B值进行多种组合变换,以此作为图像的颜色特征信息,并分析其与作物的各项特征,如水分状况、氮营养状况和病虫害情况等的相关关系,建立预测模型。

国外Aitkenhead 等采用G/(R+G+B) 特征和固定阈值法分割图像中的植物与土壤,将图像颜色值作输入BP人工神经网络,训练后的BP人工神经网络用于区分作物和杂草[19]。Kavdir将向日葵冠层图像的R,G,B 颜色值作为BP人工神经网络的输入,成功分离了图像中的杂草、土壤和向日葵[20]。

国内李存军等对封垄前和封垄后的小麦冠层图像采用不同的颜色阈值,根据其R,G,B值以及H,I 值,分割了小麦的冠层图像[23]。王晓静等采用R/(R+G+B)和B/(R+G+B)值诊断棉花铃期氮营养状况,并采用R,G,B,G/(R+G+B)等颜色特征预测作物的产量和施氮量[22]。

2.2 多光谱作物图像

多光谱图像分析超越了可见光的波长范围,采用多光谱成像仪获取图像,对图像质量要求不高。一般多光谱成像仪有3个图像通道,将光实时分离成550nm绿色,650 nm红色和800nm近红外 3个波段通道的单色图像。多光谱作物图像分析可以有效地去除背景的影响,多用于杂草识别和病虫害识别。

朱登胜等采用多光谱数字图像识别苗期作物与杂草,得出结论多光谱成像仪所提供的3个图像中,近红外IR 通道的图像非常适合用来完成植物与土壤的分割[23]。张浩等基于多光谱图像分析识别水稻穗颈瘟严重度,建立了水稻穗颈瘟严重度的多光谱图像预测模型[24]。

2.3 作物图像纹理

图像区域中,像素值不均匀分布所产生的视觉效应称为图像纹理。纹理展示了被拍摄物体表面不均匀的光学特性。不同材质的表面通常具有不同的纹理。纹理分析是模式识别和计算视觉的一个重要研究方向,其主要研究内容包括纹理描述、纹理分割和纹理分类等。与图像颜色特征相比,纹理能更好地兼顾图像宏观性质与细部结构两个方面,即可用于图像处理阶段的图像分割,又可用于图像分类识别[25]。

国外Pydipati等在实验室光照条件下,采用HIS颜色模型和色彩共生纹理分析法结合统计分类算法,对柑橘正常叶片、油斑病叶片、黑斑病叶片和疮痂病叶片识别,识别正确率超过95%[26]。

国内张静等采用归一化灰度共生矩阵,计算黄瓜角斑病和黄瓜斑疹病纹理特征参数,提取了能量、熵、惯性等特征参数描述叶片图像的病症,对比发现惯性作为区分这两种病害的特征参量更准确[27]。

2.4 形状特征

形状特征比颜色和纹理更高层,用形状描述图像内容非常直观,而且形状常与目标联系在一起。图像形状特征分析可用于作物病虫害识别、作物和杂草识别等方面。国外Chesmore等将图像形状特征分析用于小麦印度腥黑穗病孢子和黑麦草腥黑穗病菌孢子的分类,准确率达97%[28]。国内马晓丹等运用图像处理技术和神经网络技术,基于病斑颜色特征实现了大豆叶片病斑区域的识别,准确率可达100%[29]。

3 作物图像信息获取及应用分析

近年来,随着信息科学与技术的迅速发展,数字图像处理与识别技术在作物学研究方面越来越显示出巨大的应用潜力。数字图像处理技术在作物监测方面主要应用于作物水分状况诊断、作物营养诊断、土壤和杂草等背景的识别、病虫害特征提取以及叶片的形态识别等方面。

3.1 作物水分状况诊断

R. Zakaluk等用500万像素数码相机抓取土豆苗RGB数字图像,并采用人工神经网络确定其叶水势[30]。王方永等在自然光照条件下获取田间棉花群体的数字图像,镜头距地面2m垂直拍照。采用OLYMPUS C25060 Wide Zoom型数码相机,焦距固定,采取2592×1944像素(500万像素)分辨率,JPEG图像格式,以RGB颜色系统的G-R参数和棉花水分含量及水分含量指数建立回归模型,预测精度分别达到了90.71 %和91.02 %[1]。谢守勇和宋亚杰都是在日光条件下获取的金莲花叶片图像,然后分别提取RGB三色分量和它们的相对系数r,g,b及色度H进行分析,分别采用人工神经网络建模和模糊评判的方法得出了与缺水时间的关系。他们采用的图像获取方法分别是400万像素的数码相机和600万像素数码相机在现场自然光光照条件和固定目距的条件下完成[31,32]。

可见,随着图像处理技术的发展,作物图像不一定要在实验室特点光源条件下获取,用作作物水分状况诊断的作物图像也可以在自然光照条件下获取。由于采用颜色特征分析的方法,所以图像应为真彩色图像,即颜色位数应大于24位。镜头距离地面或作物的距离、拍摄角度、图像分辨率和图像存储格式并无定规,一般是由研究人员根据特定的作物情况,凭经验选取或做实验确定拍摄距离和角度对作物水分状况诊断模型的影响。要监测大面积农田作物,图像获取设备应可移动或系统中接入多个图像获取设备。

3.2 作物氮营养诊断

刘洪见等基于颜色特征和覆盖度建立了氮肥施用量线性诊断模型,R2为0.82[33]。王秀峰实现了利用数字图像处理技术进行黄瓜和番茄的氮肥推荐[34]。他利用数码相机在田间获取图像,拍照时相机与冠层成30°~60°,在1024×768分辨率下以JPEG格式存储,并得出结论:图像获取时光线的强弱对冠层图像信息没有显著的影响,在阴天拍摄的图像效果要略好于晴天。贾良良等用Olympus E20P型数码相机在田间直接获取水稻冠层图像[35]。研究中,图像的获取参照JiaL L等在小麦上的图像获取方法,以距离地面1.2m 垂直高度(距水稻冠层约1m),与地面呈60°角进行拍摄[36]。拍摄时所采用图像分辨率格式为1280×960,数字图像以JPEG 格式存储,采用Adobe Photoshop剔除土壤或水面背景的干扰,获得数字图像的红光值R、绿光值G和蓝光值B,并计算相应的红光标准化值NRI、绿光标准化值NGI和蓝光标准化值NBI。肖焱波等获取冬小麦冠层图像采用方法与上述类似,采用Olympus E20P 型单反相机,在中午12:00-13:00之间,图像拍摄时天气为阴天无光线直接照射,图像分辨率为2560×1960 像素,采用Adobe Photoshop获取冠层图像R,G,B值,并计算相应的指数,如G/R,G/B,G/(R+G+B)和R/(R+G+B)等[37]。

与作物水分状况诊断类似,作物氮营养状况诊断的作物图像也可以在自然光照条件下获取,主要采用颜色特征分析的方法,镜头距离地面或作物的距离、拍摄角度、图像分辨率和图像存储格式并无定规。

3.3 农田作物与杂草识别

作物识别和杂草识别不仅采用颜色特征分析,而且多光谱图像分析、纹理特征分析和形状特征分析也广泛应用。Steffen Gebhardt 和Walter Ku hbauch提出了一种新的基于颜色和纹理特征的识别算法,使得分类精度提高到83%,酸模识别率达到93%[20]。朱登胜等通过对多光谱成像仪获得的数字图片,采用一定的目标分割与形态学处理,对豆苗和杂草进行识别判断,能够有效识别豆苗,正确率为90.5%,所用的多光谱成像仪是MS3100,图像分辨率是1392×1040,得出结论多光谱成像仪所提供的3个图像中,近红外IR 通道的图像非常适合用来完成植物与土壤的分割[25]。袁忠兴等获取的图像大小为288×352像素,图像存取格式为BMP[38]。通过对玉米田彩色图像颜色模型的分析,发现RGB 颜色模型分量图G分量分割效果较好,适合于玉米与背景的分离。梁淑敏等用EPSON CCD PC 850Z 型相机,采集分辨率为640×480的JPEG 图像,研究玉米分形维数及其种植密度效应评价[39]。宋华锋等采用CCD 摄像机获取640×480的大豆叶片与杂草叶片图像作为测试样本,应用遗传神经网络建立对杂草图像的识别模型[40]。研究结果表明,这种图像处理技术与神经网络结合的方法,识别作物区域的准确率可达90%以上。梅汉文和刘剑英将CCD 用三脚架固定住,在离地面50cm的高度平行于地面拍摄获取实时图像,分辨率为720×576,采用2G-R-B作为颜色特征,研究了玉米和杂草与背景分割的处理方法[41]。

3.4 作物病虫害特征提取

多光谱图像分析、纹理特征分析和形状特征分析在作物病虫害提取中也广泛应用。马晓丹和关海鸥采用CCD摄像机获取作物图像,将病害区域与健康区域的颜色R,G,B等3个分量作为遗传BP神经网络的输入值,识别病斑区域,并提取了病斑的面积、周长、圆度、复杂性、伸长度、球状性、重心坐标以及长短轴比等8个形态特征参数[42]。张静等研究了黄瓜角斑病和黄瓜斑疹病的纹理特征参数,摄像头选用具备CCD 感光元件,710万像素,分辨率3072×2304,3倍光学变焦的三星数码相机,以获取高清晰的病害数字图像。作物病虫害特征提取与作物识别和杂草识别应用的分析手段相同,因此对作物图像获取系统的要求也相似[27]。

4 结论

1)作物水分及营养状况诊断多采用图像颜色特征分析的方法,比较常用的有RGB和HIS颜色模型,作物图像可以在自然光照条件下获取,镜头距离地面或作物的距离、拍摄角度、图像分辨率和图像存储格式并无定规,可用JPEG格式来存储图像,节省大量的图像存储空间。

2)土壤和杂草等背景的识别、病虫害特征提取等方面不仅采用颜色特征分析的方法,多光谱图像分析、纹理特征分析及形状特征分析也广泛应用。

3)根据不同的应用分析需要,图像颜色分辨率从288×352像素到3072×2304像素可以使识别目标达到80%~95%。图像分辨率高的识别效果好,但是分析程序用时也长,图像文件占用空间大,也影响图像传输速度和诊断的实时性。因此,获取图像时需要根据图像应用的具体情况选择合理的图像分辨率。

4)综合采用不同图像处理技术方面,利用作物图像颜色、纹理和形态等特征参数,可使作物图像分析更准确。

上一篇:理论讲授下一篇:大学生情绪调节