计算机视觉识别

2024-07-24

计算机视觉识别(共8篇)

计算机视觉识别 篇1

近年来, 随着计算机技术的迅速发展, 计算机视觉技术得到广泛的研究与开发, 计算机视觉是用计算机实现人的视觉功能, 对客观世界的三维场景的感知、识别和理解, 即对图像进行自动处理并报告“图像中有什么的过程”[1]。其研究目标是使计算机具有通过一幅或多幅图像认知周围环境信息的能力, 这使计算机不仅能模拟人眼的功能, 而且更重要的是使计算机完成人眼所不能胜任的工作[2]。计算机视觉的应用领域非常广泛, 如工业自动化生产线应用、各类检验和监视应用、视觉导航应用, 图像自动解释应用, 以及人机交互应用和虚拟现实应用等等。

物体识别是计算机视觉领域中的一项基础研究, 它的任务是识别出图像中有什么物体, 并报告出这个物体在图像表示的场景中的位置和方向。目前物体识别方法可以归为两类:基于模型的或者基于上下文识别的方法, 二维物体识别或者三维物体识别方法。对于物体识别方法的评价标准, Grimson总结出了大多数研究者主要认可的4个标准:健壮性 (robustness) 、正确性 (correctness) 、效率 (efficiency) 和范围 (scope) 。

1 特征提取与物体模型表示

物体识别方法的基本思想可以理解为:抽取出图像中的与物体有关的信息, 将这些信息与物体本身具备的信息之间进行比较, 寻找出最有可能的对应关系, 给出物体预测。目前的物体识别算法大多采用抽取物体的特征, 然后由训练数据建立物体模型, 最后将待识别的样本特征与模型进行匹配的方法[3], 于是一般的物体识别方法都有两个基本组成构件:特征提取与物体模型的表示, 物体识别方法的有效性正确性极大的依赖于他们二者之间的内在关联度。

1.1 特征提取

特征提取是物体识别的第一步, 也是识别方法的一个重要组成部分, 好的图像特征使得不同的物体对象在高维特征空间中有着较好的分离性, 从而能够有效地减轻识别算法后续步骤的负担, 达到事半功倍的效果[3], 下面对一些常用的特征提取方法进行介绍。

(1) 颜色特征。颜色特征描述了图像或图像区域所对应的景物的表面性质, 常用的颜色特征有图像片特征、颜色通道直方图特征等, 文献[4]等中对颜色的特征做了详细的介绍。

(2) 纹理特征。纹理通常定义为图像的某种局部性质, 或是对局部区域中像素之间关系的一种度量。纹理特征提取的一种有效方法是以灰度级的空间相关矩阵即共生矩阵为基础的, 其他方法还有基于图像友度差值直方图的特征提取和基于图像灰度共生矩阵的特征提取[5]。

(3) 形状特征。形状是刻画物体的基本特征之一, 用形状特征区别物体非常直观, 利用形状特征检索图像可以提高检索的准确性和效率, 形状特征分析在模式识别和视觉检测中具有重要的作用。通常情况下, 形状特征有两类表示方法, 一类是形状轮廓特征描述, 另一类是形状区域特征。形状轮廓特征主要有:直线段描述、样条拟合曲线、博立叶描述子、内角直方图以及高斯参数曲线等等, 形状区域特征主要有:形状的无关矩、区域的面积、形状的纵横比等[6]。

(4) 空间特征。空间特征是指图像中分割出来的多个目标之间的相互的空间位置或者相对方向关系, 有相对位置信息, 比如上下左右, 也有绝对位置信息, 常用的提取空间特征的方法的基本思想为对图像进行分割后, 提取出特征后, 对这些特征建立索引。

1.2 模型表示

模型表示涉及到物体具有那些重要属性或特征以及这些特征如何在模型库中表示, 有些物体模型定义为一系列局部的统计特征, 即generative模型, 有些是采用物体的特征以及物体特征之间的相互关系定义的, 比如位置关系等, 即discriminative模型, 或者是二者的混合模型。对于大多数物体来说, 几何特征描述是可以很有效的;但对于另外一些物体, 可能需要更一般的特征或函数来表示。物体的表示应该包含所有相关信息, 但没用任何冗余信息, 并且将这些信息以某种方式组织起来, 使得物体识别系统的不同组元能够容易访问这些信息。

2 经典的物体识别方法

物体识别方法就是使用各种匹配算法, 根据从图像已提取出的特征, 寻找出与物体模型库中最佳的匹配, 它的输入为图像与要识别物体的模型库, 输出为物体的名称、姿态、位置等等。大多数情况下, 为了能够识别出图像中的一个物体, 物体识别方法一般由5个步骤组成:特征提取;知觉组织;索引;匹配;验证。下面介绍几种物体识别中的经典方法。

(1) Bag of words (BoW) 方法。BoW方法主要是采用分类方法来识别物体, BoW方法是来自于自然语言处理, 在自然语言处理中是用来表示一篇文档是有一袋子词语组成的, 在计算机视觉的物体识别方法中, 将图像比作文档, 将从图像中提取的特征比作词语, 即一幅图像是有一袋子特征组成的, 如图1所示。BoW方法首先需要一个特征库, 特征库中的特征之间是相互独立的, 然后图像可以表示为特征库中所有特征的一个直方图, 最后采用一些生成性 (generative) 方法的学习与识别来识别物体[3]。

(2) Parts and structure方法。BoW方法的一个主要缺点为特征之间是相互独立的, 丢失了个位置信息, Parts and structure方法采用了特征之间的关系, 比如位置信息和底层的图像特征, 将提取出的特征联系起来, 如图2所示, Pictorial Structure (PS) 提出的弹簧模型, 物体部件之间的关系用伸缩的弹簧表示, 对于特征之间的关系的模型表示, 还有星型结构、层次结构、树状结构等。

(3) 生成性 (generative) 方法与鉴别性 (Discriminative) 方法。生成性方法检查在给定物体类别的条件下, 图像中出现物体的的可能性, 并以此判定作为检测结果的得分, 鉴别性方法检查图像中包含某个类别出现的可能性与其他类的可能性之比, 从而将物体归为某一类[3]。

3 基于模型 (model) 的物体识别方法

现在主流的物体识别的基本方法都可以集合为一类:基于模型的物体识别。基于模型的物体识别方法首先需要建立物体模型, 然后使用各种匹配算法从真实的图像中识别出与物体模型最相似的物体, 它的主要任务就是要从二维或三维图像抽取的特征中, 寻找出与模型库中已建好的特征之间的对应关系, 以此来预测物体是什么。这个方法主要涉及到两个难点, 一是如何选取合适的图像特征以及如何改进, 二是如何恰当的定义物体模型并建立抽取的特征与模型库中特征的对应关系。

在贾云德《机器视觉》一书中, 从4个主要模块以及不同模块之间的作用和信息流向图描述了基于模型的物体识别系统, 4个模块为模型库、特征检测器、假设生成 (hypothesis formation) 和假设验证 (hypothesis verification) , 如图3所示。这个系统首先将图像输入到特征检测器中, 输入图象可以是灰度或彩色图象、二维三维图像, 然后特征检测器对图象的特征进行检测, 并对特征进行定位, 随之在假设生成模块中, 使用图像特征来给场景中的物体分配一个可能值, 最后利用模型库, 通过假设验证给出物体类别的一个最可能的值。特征检测器即是从图像中提取特征;假设生成是指可以根据物体特征首先建立可能的物体集合, 并给每一可能的物体分配置概率值, 这个过程基本上是一种启发式过程, 由此可以减小搜索空间;假设验证是从候选物体中选出最可能的物体, 这个过程在物体识别的某些方法中是可以省略的, 比如模式分类方法;模型库包含有所有的已知模型, 模型库的信息取决于物体识别方法, 可以是定量、定性或函数描述, 也可以是精确的几何曲面信息, 一般来说模型库是一种索引图, 这样有利于从所有可能的物体集合中去除那些不可能的候选者。

4 基于上下文 (context) 物体识别方法

在基于模型的物体识别方法中, 物体所处的情景 (context) 使得物体的识别变得更加困难, 然而在现实世界中, 相反的是, 物体所处的情景为识别物体提供了更加丰富有用的信息, 在现实世界中任何一个物体都不会单独的出现, 它会出现在某些情景中, 或者伴随其他物体一起出现, 当人们观察并推测一个物体是什么时, 除了根据物体自身具备的特征之外, 还有就是基于物体所处的上下文来推断。虽然基于模型的物体识别方法仅仅利用了物体的特征信息, 有效缩减了识别物体的时间, 但是却完全忽略了物体出现的情景, 这时就会引出一些错误的判断, 比如在网球场, 如果不考虑网球场这个场景, 那么网球就会被识别为柠檬, 当考虑到场景时, 网球会很快并且被识别出来, 并且不会被识别错, 于是研究者们在研究物体识别的方法时, 开始考虑物体所处的上下文, 结合上下文, 有助于更好的解释物体, 比如玩具车和真实的轿车, 他们所处的场景是不同的, 有些物体也只能出现在某些场景, 本文将此类方法归纳为基于上下文 (context) 的物体识别方法。

基于上下文识别物体的难点在于如何对物体与其上下文之间建立关系, 这些关系比如有, 桌子和椅子很容易同时出现, 大象和床非常不可能同时出现, 车很多时候都是出现在马路上等, 物体与其上下文之间的关系也有强弱之分, 比如一个盘子大部分时候是出现在桌子上, 但是出现在其他地方也是有可能, 但是消火栓会一直在人行道上, 对于这些物体与上下文之间的强弱关系, 现在已有相关工作进行了概述。物体与其上下文之间的关系是通过对包含此物体的图像的低级特征进行统计得出的, 文献[7]用实验验证了当采用物体的上下文和物体的外观描述时, 可以更有效的识别出物体, 当识别的物体由于某些原因, 比如模糊, 不能自己的特征识别时, 文献[8]提出了“chains model”方法采用物体的上下文来识别物体, 基于上下文的识别方法已成为了一种新的有效识别物体方法, 在2010 CVPR中就有很多有关上下文识别物体方法的文章, 如文献[8,9]等。

5 困难与前景

虽然物体识别已经被广泛研究了很多年, 研究出大量的技术和算法, 物体识别方法的健壮性、正确性、效率以及范围得到了很大的提升, 但是现在依然存在一些困难以及识别障碍。对于人类的视觉来说, 物体识别是件很容易的事情, 但是对于计算机来说, 却不是件容易的事情, 这些困难主要有:

(1) 获取物体的观测数据时会受到多方面的影响。在不同的视角对同一物体也会得到不同的图像, 物体所处的场景的背景以及物体会被遮挡, 背景杂物一直是影响物体识别性能的重要因素, 场景中的诸多因素, 如光源、表面颜色、摄像机等也会影响到图像的像素灰度, 要确定各种因素对像素灰度的作用大小是很困难的[10], 这些使得图像本身在很多时候并不能提供足够的信息来恢复景物。

(2) 知识导引。同样的图像在不同的知识导引下, 会产生不同的识别结果, 知识库的建立不仅要使用物体的自身知识, 如颜色、纹理、形状等, 也需要物体间关系的知识, 知识库的有效性与准备性直接影响了物体识别的准确性。

(3) 物体本身是一个高纬信息的载体, 但是图像中的物体只是物体的一个二维呈现, 并且在人类目前对自己如何识别物体尚未了解清楚, 也就无法给物体识别的研究提供直接的指导。

目前人们所建立的各种视觉系统绝大多数是只适用于某一特定环境或应用场合的专用系统, 而要建立一个可与人的视觉系统相比的通用视觉系统是非常困难的, 虽然存在着很多困难, 但是随着人类对自己视觉的逐步了解, 一个通用的物体识别技术终会被研究成功。人们一直致力于开发各种智能工具辅助人们的生产生活, 比如机器人的研制, 但是要想使得机器人可以像人一样运动, 辅助人们的工作生活, 那么前提是机器人必须具备类似于人的视觉系统, 能够识别物体以及场景, 真正的智能工具应该要具备“视觉”。物体识别技术的成功将会极大改变提高智能工具的能力, 成为计算机技术里程碑式的一项研究。

6 结束语

文章从物体识别方法的特征提取与物体的表示这两个基本组成构件开始阐述, 然后从微观角度对物体识别的四类经典方法 (Bag of words, Parts and structure, generative method和Discriminative method) 进行了简要概述, 接下来从宏观的角度讲述了两类物体识别方法, 基于模型的物体识别方法与基于上下文的物体识别方法, 文章的最后简要阐述了物体识别方法的困难与前景。物体识别技术的成功, 正如生命演化史中眼睛的诞生一样, 将会极大的拓展了计算机视觉的应用领域, 并会使得各种智能工具更加的智慧。

参考文献

[1]Wesley E.Snyder, Qi Hairong.机器视觉教程[M].北京:中国机械出版社, 2005.

[2]张广军.机器视觉[M].北京:科学出版社, 2005.

[3]王利明.机器视觉中物体识别方法的研究与探讨[D].上海:复旦大学, 2009.

[4]K.van de Sande, T.Gevers, C.Snoek.Evaluation of color descriptors for object and scene recognition[C].Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, pp.1-8, June 2008.

[5]王惠明, 史萍.图像纹理特征的提取方法[J].中国传媒大学学报 (自然科学版) , 2006, 13 (1) :49-52.

[6]柳群英.基于形状特征的图像检索技术[J].情报杂志, 2004, 23 (4) :87-88.

[7]LeeY.J., GraumanK..Object-graphsforcontext-awarecategorydiscovery[C].Proceedings of IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , 2010.

[8]Karlinsky L., Dinerstein M., Harari D., Ullman S.The chains model for detecting parts by their context[C].Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, June.2010, pp.25-32.

[9]B.Yao and L.Fei-Fei.Modeling mutual context of object and human pose in human-object interaction activities[C].Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition, San Francisco, CA, USA:IEEE, 2010.

[10]P.Felzenszwalb, D.Mcallester, and D.Ramanan.A Discriminatively Trained, Multiscale, Deformable Part Model[C].Proceedings of IEEE International Conference on Computer Vision and Pattern Recognition, 2008.

计算机视觉识别 篇2

08市场营销2班

张静珊

08250190837

一、概念简介

视觉识别系统属于CIS中的VI(Visual Indentity)。视觉识别(VI)是以企业标志、标准字体、标准色彩为核心展开的完整、体系的视觉传达体系,是将企业理念、文化特质、服务内容、企业规范等抽象语意转换为具体符号的概念,塑造出独特的企业形象。视觉识别系统分为基本要素系统和应用要素系统两方面。基本要素系统主要包括:企业名称、企业标志、标准字、标准色、象征图案、宣传口语、市场行销报告书等。应用系统主要包括:办公事务用品、生产设备、建筑环境、产品包装、广告媒体、交通工具、衣着制服、旗帜、招牌、标识牌、橱窗、陈列展示等。

视觉识别(VI)在CI系统中最具有传播力和感染力,是运用系统的、统一的视觉符号系统,对外传达企业的经营理念与形象信息,是企业识别系统中最具有传播力和感染力的要素。它接触的层面是广泛,可快速而明确地达成认知与识别的目的。视觉识别是静态的识别符号具体化、视觉化的传达形式,项目最多,层面最广,效果更直接。

二、安踏简介

安踏(中国)有限公司创建于1991年,简称安踏体育、安踏,总部设在福建泉州市晋江,是中国一家知名的品牌体育用品企业,主要设计、开发、制造及销售运动服饰,包括“安踏”品牌的运动鞋类及服装,旗下有香港安大国际投资有限公司、安踏(福建)鞋业有限公司、北京安踏东方体育用品有限公司等。十多年来,安踏公司秉承“安心创业、踏实做人、创百年品牌”的经营理念,经过不懈努力,已发展成为国内最大的集生产制造与营销导向于一体的综合性体育用品企业。

三、安踏的企业视觉识别系统收集

(一)安踏的企业名称释义

【安踏】安,安心创业。踏,踏实做人。安踏品牌是用 一种客观的、直接的文字,陈述着它持久不变的品牌根源。安踏品牌的精神已超越国家和文化的界限,将“超越自我的体育精神”融入到每个人的生活。安心创业,踏实做人。正是“安踏”名字的来源。

【Anta】是中文“安踏”的英文名,在希腊语中的意思是“大地之母”。体现出安踏无比的胸怀和对世界与人类的奉献精神。希腊是现代奥林匹克运动会的发源地,选择“Anta”具有极为深刻的含义,它喻指安踏品牌所奉行的奥运精神和产品的运动性,它涵盖了安踏的文化和灵魂,以及安踏广告现代体育精神。“安踏”品牌应用“Anta”的英文名,表明安踏品牌是一个国际化、民族化的专业体育用品品牌。同时也反应出安踏人不断创新、敢于拼搏、挑战自我的精神,表达了安踏企业决心要做民族的“安踏”,百年的“安踏”和世界的“安踏”。

(二)安踏的企业标志

整个标志为字母“A”的字型体,由四段半径不同的圆弧线交汇而声成。整体构图简洁大方,富于动感。图形鲜红的色彩代表了安踏的活力与进取精神。圆弧构造出的空间感展现了安踏人开拓创业的无限发展前景,变型的“A”则抽象出一只升腾而起的飞行形象,以极其简约,概括的手法展现了力量、速度与美三元素在运动中的优美组合,并从广义上喻意安踏追求卓越、超越自我的理念。

(三)安踏的宣传广告语

安踏的宣传广告语是“Keep moveing…永不止步”。这个广告语是安踏把运动“将超越自我的体育精神融入每个人的生活”的理念和精神传递给每个消费者的体现。也是安踏“到2011年将成为中国市场品牌美誉度和市场份额双第一的体育品牌,并成为全球销售额排名前十的体育用品公司”的企业愿景的体现。

四、安踏视觉系统的优缺点分析

(一)优点:VI的基本要素系统完整,运用系统基本到位

正如上文所提及到的关于安踏的视觉识别系统的具体内容,可以看出安踏的视觉识别系统的基本要素系统完整,并且自己对于该系统全面而完整的诠释。

在VI的运用过程,基本可以体现出安踏的企业和品牌形象,具体如图:

(二)缺点:VI的运用系统稍有不足

VI的运用系统主要包括:办公事务用品、生产设备、建筑环境、产品包装、广告媒体、交通工具、衣着制服、旗帜、招牌、标识牌、橱窗、陈列展示等。

在安踏的专卖店的建设中,可能由于店面扩张速度过快,连锁经营的标准化管理实施不到位,以致我们可以感觉到安踏的VI运用系统在实际的操作实施过程是不尽完美的。

第一,各个专卖店的门面命名不够统一,有的是名为“安踏”,有的名为“Anta”,有的名为“安踏体育”,虽然这三者都是安踏的名称简称,但是门面店命名上的不统一就不能给消费者带来统一的视觉识别。

第二,店面装修设计风格不统一。上图中安踏的专卖店店面设计主要以红白色为主体色,但有些安踏专卖店是以黑白色为主体色,而且两者在店内的装修设计上也存在很明显的差别,这也容易操作消费者的视觉甚至心理误会。

计算机视觉识别 篇3

关键词:蚕蛹,性别识别,MATLAB,图像处理,神经网络

0 引言

在蚕种生产过程中,蛹体雌雄鉴别的准确率直接关系到蚕种的质量和品种的纯度。我国蚕茧产量占世界总产量的3/4,每年需要切削种茧5 000t,在蚕茧制种时,需要将蚕蛹从蚕壳中分离出来进行雌雄鉴别。目前普通是用人工进行削茧和鉴蛹,劳动强度大、生产效率低,对操作的熟练程度有较高的要求,经常出现操作人员被割伤现象。而且种茧切削、雌雄鉴别须在5~7天之内完成,蚕种场不得不招聘大批短期劳动力,使蚕种生产成本大大提高,且忙乱中难免造成雌雄混淆,以致发蛾后同系自交成纯种,严重影响了蚕种质量[1]。

为区别蚕茧性别,日本曾根据蚕茧的质量来区分雌雄茧,并制造了蚕茧雌雄鉴别机;但由于错判率较高,未能得到推广应用。国内有人利用荧光法鉴别雌雄茧,但只适用于茧色判性品种及其特定的杂交组合[2]。潘沈元等曾用近红外反射光谱的模式识别方法对雌雄蚕茧的识别进行了初步探讨,但还有许多问题值得进一步研究,如样品的代表性和特征值选取的合理性问题[3]。

随着计算机技术和神经网络技术的发展,利用数字图像处理技术和神经网络进行模式识别在实际应用中取得了良好的效果。因此,本文通过MATLAB平台,利用计算机图像处理技术,对获取的雌雄蚕蛹图像进行预处理后,根据提取的形体特征和尾部纹理特征,用BP神经网络对蚕蛹雌雄进行分类识别。

1 图像获取

识别系统的总框图,如图1所示。

本文采用1 000万像素数码摄像头拍摄蚕蛹图片。为了与自动分选系统结合,将蚕蛹经传送带匀速送入一透明有机玻璃U型槽中。传送带速度可控,保证蚕蛹单粒送入U型槽中进行拍照,在垂直于U型槽的圆周方向相隔120°各设置一个摄像头,对U型槽中的蚕蛹进行全方位的图像采集,以获得蚕蛹的真彩图像,即RGB图像。图像获取装置如图2所示。

由于蛹的雌雄具有不同的特征,从外形来比较,雌蛹体较肥大,腹部末端较圆;雄蛹体较瘦小,腹部末端较尖。但更主要是从性征上来区别,雌蛹在第8环节(翅下第5环节)腹面的中央,从前缘到后缘有“x”状纵线;雄蛹在第9环节(翅下第6环节)腹面的中央有似凹陷小点[4]。所以,选择提取蚕蛹的几何即体型和尾部纹理特征来对蚕蛹雌雄进行识别。雌雄蚕蛹尾部性状特征如图3所示。

2 图像预处理

2.1 图像滤波

图像获取过程中由于受各种因素的影响会产生噪声污染,噪声会影响到图像处理全过程以至输出结果,因此滤除图像中的噪声是图像处理中极为重要的步骤[5]。脉冲噪声在图像噪声中最为常见,其概率密度函数为

其中,z表示图像中像素灰度值。如果b>a,灰度值b在图像中将显示为一个亮点;相反,a的值将显示为一个暗点。本文采用矢量中值滤波方法,矢量中值滤波器的输出值为滑动窗口中矢量集合的中值。对于具有N个矢量的集合V={v1,v2,…,vN},求中值矢量的算法如下:

1)对于每个矢量计算它到其余矢量的距离之和Si,有

2)从S1~SN中求出最小值Smin,记录其下标。

3)该下标所对应的vVMF即为这组矢量的中值,也就是矢量中值滤波器的输出vVMFvVMF∈V,则

应用矢量中值滤波方法,对蚕蛹图像进行了增强。在矢量中值滤波器中,算法在滑动窗口中寻找一个距离其他像素最近的像素,并以此像素代替原中心像素,因此能够有效地滤除脉冲噪声,并具有相对好的边缘保持特性。

在MATLAB中,实现这个功能的函数是

其中,A为待处理图像,[m n]为设定区域大小。

2.2 图像分割

为了有效地进行图像分析,往往需要先进行图像分割,将图像中有意义的特征或者需要应用的特征提取出来,也就是把图像中的一些干扰景物去掉,最大限度把蚕蛹本身图像从背景环境中“抓取”出来,以提高量化特征值的准确性。本文采用的是边缘检测和匹配分割的方法;边缘的检测是利用物体和背景在某种图像特性上包括灰度、颜色或者纹理特征等的差异来实现的;匹配分割可以用于搜索特殊的模式,笔者用一幅图像抽取出物体或模式,指导在余下的图像中基于某种最优性准则搜索相同或相似的模式,在本文中就是对具有不同纹理特征的蚕蛹尾部进行搜索。分割后的雌蛹尾部纹理图,如图4所示。

2.3 图像灰度化

图像灰度化是进行图像识别的基础,灰度化处理就是把彩色图像转变为黑白图像,这样可以去除颜色的干扰,从而为获取与颜色无关的几何、形态等特征做好准备。本文获取蚕蛹RGB图像时,分别用红、绿、蓝3个色度值为一组,代表每个像素的颜色。处理图像的时候,要分别对RGB 3种分量进行处理。实际上RGB并不能反映图像的形态特征,只是从光学的原理上进行颜色的调配,所以经常要把图像弄成灰度值图像直接进行处理。

在MATLAB中,直接调用rgb2gray函数把真彩图像转换为灰度图像。有

转换后的灰度图像如图5所示。

2.4 图像二值化

将256个亮度等级的灰度图像通过适当的阈值选取可以获得反映图像整体和局部特征的二值化图像。所有灰度大于或等于阈值的像素被判定为属于特定物体,其灰度值以255表示,否则这些像素点被排除在物体区域以外,灰度值为0。

使用MATLAB自带的in2bw函数,通过设定亮度阈值将灰度图像转换成二值图像,如图6所示。此时,T=0.6。

3 特征提取

特征提取是对模式所包含的输入信息进行处理和分析,将不易受随机因素干扰的信息作为该模式的特征提取出来。

3.1 形体特征

形状特征描述目标区域的几何性质,与区域的颜色无关。面积和周长是描述块状图形大小的最基本特征。面积S是图像中前景区域大小的度量,粗略地讲,该面积为图像中非零像素的数目。在MATLAB中,使用函数bwarea来计算二进制图像的面积S。图形周长L为图像上相邻边缘间距离之和。本文采用8邻点距离求周长,则图像中任何两相邻边缘点间的距离都为1,而倾斜方向上相邻边缘像素间的距离为槡2。圆形度R0用来描述物体形状接近圆形的程度,其计算式为

其中,S为面积,L为周长;R0范围为0

3.2 纹理特征

纹理特征反映了图像自身的属性,纹理特征提取是进行图像纹理描述、分类的关键环节,直接影响后续处理的质量。灰度共生矩阵(GLCM)是基于统计的分析方法中被广泛应用的纹理特征提取方法,GLCM函数通过计算图像中特定的像素在某一空间位置关系中出现的次数来刻画纹理特征。在MATLAB图像处理工具箱中,graycomatrix函数用来创建灰度共生矩阵,使用graycoprops函数来计算统计信息,这些信息提供了关于图像纹理的信息。本文中选用角二阶矩(能量)、对比度(惯性矩)、相关、熵和逆差矩等5个特征[6,7,8,9]。

4 神经网络分类器设计

目标图像预处理完成以后,就要用神经网络对样本进行训练以及识别,本文用的是前馈反向传播网络—BP(Back Propagation)神经网络。BP网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入—输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(output layer)。BP神经网络结构示意图如图7所示。

本文中,采用MATLAB神经网络工具箱中BP网络作为分类器模型。由于任何在闭区间内的一个连续函数都可以用单隐层的BP网络逼近,因而一个3层BP网络就可以完成任意的n维到m维的映射,所以本文使用3层神经元网络,输入层神经元用面积、周长、圆形度和5个纹理特征共8个特征构成特征向量,隐层节点数为11个,输出层节点数2个,输出为0,1两种值的组合,用10和01分别表示雌蛹和雄蛹。选择中间层神经元的传递函数为S型正切函数,输出层神经元的传递函数为0-1函数即S型对数函数,训练次数50,误差小于0.1。命令代码如下:

其中,P为输入矩阵,T为输出矩阵[10]。

5 结论

应用上述方案对871A和7532两个品种的蚕蛹图像进行了识别试验,每一品种取50个样本进行训练,50个样本进行测试,BP网络训练收敛,再用训练好的BP神经网络进行分类,识别率分别达到了98%和96%,符合识别准确率95%以上的育种要求。试验表明,利用计算机数字图像处理技术和神经网络技术对蚕蛹的雌雄性别自动识别方法是可行的,为蚕蛹的性别识别提供了一种新的方法,省去了人工识别的繁琐劳动,提高了劳动效率和识别的准确率。但是由于本次试验样品仅为两个品种而且标本数量较少,模型的可信度和稳定性需要在多品种、大样本下才能得到验证,模型的预测精度和稳定性需要进一步提高,而且蚕蛹图像特征的选择和特征量的提取及BP神经网络参数的选择也要进一步的研究。

参考文献

[1]胡祚忠,吴建梅,张剑飞,等.我国蚕桑生产机械设备的研究概况[J].蚕业科学,2010,36(6):998-1003.

[2]刘敬全,于振诚,崔玉梅,等.家蚕荧光茧色判性蚕品种荧光、春玉的育成及其一代杂交种的选配[J].蚕业科学,1996,22(3):155-159.

[3]潘沈元,陶鸣,孙爱群.雌雄蚕蛹近红外发射光谱的差异及其模式识别[J].昆虫学报,1996,39(4):362-365.

[4]冯家新.蚕种学[M].北京:中国农业出版社,1993.

[5]范立南,韩晓微,张广渊.图像处理与模式识别[M].北京:科学出版社,2007.

[6]王爱玲,叶明生,邓秋香.MATLAB R2007图像处理技术与应用[M].北京:电子工业出版社,2008.

[7]张强,王正林.精通MATLAB图像处理[M].北京:电子工业出版社,2012.

[8]余成波.数字图像处理及MATLAB实现[M].重庆:重庆大学出版社,2003.

[9]Svoboda T,Kybic J,Hlavac V.Image Processing,Analysis,and Machine Vision:A MATLAB Companion[C]//Thomson Engineering,2008.

计算机视觉识别 篇4

关键词:龙井茶级别,嫩芽状态,RGB颜色模型,图像分割

1 概述

随着我国经济的不断发展,人们对于物质生活的追求越来越高,对于各种养生保健的食物或药品越来越看重。茶叶作为一种健康、绿色、养生的饮品,已经成为目前我国大众消费的养生饮品,在国外也有很大的影响力,自建国以来,我国就是茶叶生产、出口、销售的世界大国,到目前,我国的很多品牌茶叶在国际上都享有盛誉,也是很多国家追求的养生饮品。在我国的众多茶叶中,龙井茶是一种非常有名的茶叶,是我国产茶大省———浙江省的著名茶叶,龙井茶叶的出口和销售,对于浙江省的经济收入来说,是非常重要的,而我国的经济增长和发展来说,也具有非常重要的意义。

在传统作业方式中,对于龙井茶叶的采摘工作,主要是采用人工作业的方式来完成,但是人工手工采摘龙井茶叶,不仅效率低下,而且成本极高,再加上人工招聘以及管理等方面的困难都在限制龙井茶叶生产效率的提升。此外,人工作业的方式很容易造成龙井茶嫩芽与老叶的混淆采摘,对于龙井茶嫩叶和嫩芽的破坏也是非常致命的,这都使得龙井茶最终的质量难以令人满意。当前计算机技术飞速发展,通过计算机图像处理的视觉技术来自动识别龙井茶嫩芽,然后通过相应的机械设备有选择性地、针对性地、高效地低损伤自动采摘龙井茶嫩芽和嫩叶,从而提升龙井茶的采摘效率和质量。所以针对使用计算机的视觉技术来实现龙井茶嫩芽采摘的学习和研究,对于提升龙井茶生产效率和生产质量,以及促进社会经济的快速发展来说,具有非常重要的现实意义。

2 龙井茶的品种、等级界定及其采摘技术

龙井茶自古以来就是我国非常闻名的茶叶,在我国古代就享有盛誉,而浙江杭州则是龙井茶的主要产地。虽然在整个杭州地区,由于不同的地区产的龙井茶品种是存在差异的,即便是同样的地区、同一棵茶树,其不同的嫩芽程度所产出的龙井茶的品质也是不一样的。例如,在传统的认识中,浙江地区中的所有龙井茶以杭州地区产的龙井为优,而杭州地区的龙井茶中,则又分为常见的三种,分别为越州龙井、钱塘龙井、西湖龙井,而其中则以西湖龙井茶的茶品、茶色、茶味最为上品,一直是我国众多茶叶品种中位列第一的茶叶品牌。当然,随着栽培技术的不断提升,以及基因工程、植物杂交工程和嫁接技术,我国龙井茶叶的培育越来越多。目前,除西湖地区之外的其他地方的龙井茶的培育与生产工艺也都日益成熟,形成了在味道、茶色、茶品等多方面都能媲美西湖龙井茶的新茶品,在我国的茶叶生产和销售市场中也占有非常重要的地位。

对于同一种茶叶来说,单就茶叶的外形、鲜嫩程度以及长势程度来决定龙井茶的等级,可分为五个等级的龙井茶品质,分别为特级、一级、二级、三级、四级。对于特级的龙井茶界定,要求茶叶叶片手感光滑、舒展扁平,且要求一芽一叶的初展状态或单芽;对于一级龙井茶界定,要求叶片手感光滑、叶片较为扁平,一芽两叶的初展状态或者一芽一叶的状态;对于二级龙井茶的界定,要求茶叶叶片较为扁平,且一芽二叶的完全开展;对于三级龙井茶的界定,要求茶叶叶片一芽二叶的完全开展状态,在二叶之间可长有一少部分的对夹叶;对于四级龙井茶的界定,要求茶叶叶片欠光洁且完全舒展开来,并且要求一芽二叶、一芽三叶或对夹叶。

茶叶的品种不同、需要采摘的茶叶等级一样,其采用的采摘技术、采摘时间也大不相同。比如,对于特级龙井茶的采摘,必须要求在茶叶的适摘阶段,必须在清明节之前,茶树的顶层嫩芽刚刚发出或之长出一个嫩叶但未开展时,需要对单芽或者一芽一叶的初展茶芽进行采摘。当然,在采摘时只能将单芽或者初展状态的一芽一叶采摘下来。在对特级龙井茶的生产过程中,如雀舌、龙牙等,雀舌则是要求只能有初展状态的一芽一叶的龙井茶芽进行炒制加工生产的茶叶,而龙牙则是要求只能有单芽的龙井茶叶进行炒制加工生产的茶叶。所以在对特级龙井茶的采摘过程中,更需要将二者进行区分。对于龙井茶的其他级别,则是在清明节之后的时间进行采摘,如四级龙井茶,则要求在谷雨节气之前进行采摘,此时茶叶叶片较为肥大。而一级到三级龙井茶,则要求在清明节之后到谷雨节之间进行采摘,根据不同的等级的龙井茶要求,进行茶叶叶片的选择和采摘,并对其进行区分后进行炒制加工处理。

所以,对于龙井茶的采摘工作,需要在人工采摘之后,然后选择、分选,再送到炒制加工厂进行后期的生产处理。

3 使用计算机视觉技术对龙井茶嫩芽识别方法的研究

针对龙井茶等级区分的研究可以表明,在龙井茶采摘过程中主要是对龙井茶的茶叶、芽的叶片形状、光泽度、颜色、叶芽个数和长势等诸多方面的选择,以及最后的摊放和筛选的过程,如果单纯地利用人工作业,不仅采摘效率低下,而且很容易对龙井茶茶叶的叶芽造成损伤,致使最终的龙井茶质量降低。采用计算机视觉技术,可以采用计算机的方式,对龙井茶的茶叶嫩芽识别、采摘、嫩芽筛选等过程实现自动化处理。对于自动化采摘和筛选,通过机械臂和分装器即可实现,而整个自动化的过程核心,则是对龙井茶嫩芽的识别技术中。在对龙井茶茶叶采摘技术的研究可以知道,在对龙井茶茶叶的嫩芽识别重点放在嫩芽颜色、形状以及叶片状态与个数来判断茶叶嫩芽的级别,所以在利用计算机视觉技术来识别判断龙井茶嫩芽时,就要重点放在龙井茶嫩芽的颜色以及最终的形状的判断。

3.1 计算机视觉技术的图像分割

图像分割主要是对图像的内容,根据某些特征进行切分,从而得到不同属性的图像,然后在进行其他方面的处理。由于在一个图像中,具有相同属性(如颜色、明暗程度等)的图像,在其区域内呈现出相同的特征,那么不同属性的图像则表现出了不同的区域,在区域与区域之间的连接处,就形成了明显的边缘。所以图像分割的前提是能够检测到图像区域的边缘值。利用图像边缘检测的方法来实现图像分割主要是采用图像二值化方法来实现,这样一来不仅能够减少数据存储量,而且能够提升计算机处理的速度,对于图像处理来说是非常有益的。

使用计算机视觉技术在对龙井茶嫩芽识别方法,在获取到龙井茶图像后,首先对其进行边缘检测和图像分割,从而实现了嫩芽与其他茶叶叶片的区分,然后对分割后的图像进行其他处理,如上述的颜色对比,还有就是根据形状特征来获取嫩芽叶片的个数以及伸展情况,从而判断出整个嫩芽所属的龙井茶级别,同时根据其形状特征,为机械臂采摘提供有效的采摘点,进而实现龙井茶嫩芽的自动化识别和采摘。

3.2 计算机视觉技术的颜色模型

在计算机视觉技术中,对于图像颜色的判断是图像识别中非常重要的一个环节。所以在整个龙井茶嫩芽自动化识别系统中,首先要对整个系统中的图像核心内容进行颜色识别,以判断整个嫩芽目前的颜色状态。

在整个图像颜色判断中,RGB颜色模型是常见的一种对图像进行处理的颜色模型。在整个颜色色系中,有一个统一的认识就是所有的颜色都是可以通过三种基色来调和得到,即对红(Red)、绿(Green)、蓝(Blue)三种按照不同的比例进行混合即可得到所有的颜色。按照这种思想进行反推,在图像视频系统中,任何采集到的颜色都是可以通过红、绿、蓝三种基色按照不同的比例来实现,如果能够得到其R、G、B三种基色的比例值,那么就可以对任何一种颜色进行区分、存储、识别、展示等。如图1.所示,为RGB颜色模型中的原理结构图。

在图1中所示,RGB模型将所有的颜色容纳在一个正方体内,即按照三原色比例配比的思想,将所有颜色进行反推,从而得到三种颜色的不同比例。假如最大比例为1,三种颜色在1范围内进行选择,从而形成三个数据轴,那么在对三原色进行选取的时候,就可以按照相应的比例来得到最终的颜色。比如,对于黑色,即所有的颜色比例均为0即可得到黑色(即无物品展示),如果三种颜色选择同样的比例,即得到了白色,如果选择比例为1的红色和绿色,即得到了黄色。所以,在构建了所有颜色的数据库之后,在获取到视频图像后,即可对图像内核心区域的颜色进行对比,从而得到三原色的比例数据并存储到计算机中,而后与期望的某个数据值范围进行对比,如果在整个范围内,那么视频图像的核心区域的颜色即满足颜色要求。

在对龙井茶嫩芽特级茶叶的识别中,首先颜色是其中一个非常重要的判断指标,如果颜色太过深绿,那么就说明该叶片不属于特级茶种,如果颜色比较嫩绿,那么就从颜色指标中,就说明该茶叶有可能属于特级茶种,此时就需要从另外一个方向的指标来判断。利用计算机,则可以将嫩绿的三原色数值分析,并设定为嫩绿数据的阈值,在得到茶叶数据图像后,即可对其图像中的核心区域(可通过前期的图像数据处理和边缘检测来获取不同的区域)中的颜色进行对比,如果小于阈值范围,那么就说明在颜色指标上,能够满足特级茶叶的要求,然后再在其他方面的指标进行分析。

4 总结

利用计算机视觉技术来对龙井茶嫩芽实现自动识别,主要是利用计算机图像处理的技术和方法,通过前期的图像采集和预处理,得到可处理的有效数据源,然后对数据进行图像分割,然后对核心区域的图像数据进行颜色判断和形状特征对比,最终得到当前图像内的核心区域中龙井茶嫩芽的级别,并且为龙井茶的自动采摘提供合理采摘点,最终实现龙井茶采摘的自动化。

参考文献

[1]张立周,侯晓宇,张玉铭等.数字图像诊断技术在冬小麦氮素营养诊断中的应用[J].中国生态农业学报.2011(5):1168-1174.

[2]杨北方,韩迎春,毛树春等.基于数字图像的棉花长势空间变异分析[J].棉花学报.2015(6):534-541.

[3]崔天依.计算机视觉技术及其在自动化中的应用[J].电脑知识与技术.2016(03).

[4]邹庆华,张月雷.计算机视觉技术应用[J].信息通信.2015(12):183-184.

[5]张善文,王献峰.基于加权局部线性嵌入的植物叶片图像识别方法[J].农业工程学报.2011(12):141-145.

计算机视觉识别 篇5

关键词:计算机视觉,纽荷尔形状,圆度算法,弦长比法,SOM网络

1 引 言

计算机视觉是以计算机和图像获取部分为工具, 以图像处理技术、图像分析技术、模式识别技术、人工智能技术为依托, 处理所获得的图像信号, 并从图像中获取某些特定信息。计算机视觉技术无需接触特定对象便可从获取的图像中得到大量的信息, 通过对这些信息的分析得到物体尺寸、表面缺陷、外观形状、表面色度等具体信息, 进而实现外观质量的综合评价。

水果的外形是分级的重要特征。许多人都对这一问题进行过研究。如苹果的果梗和花芬的识别, 用曲线拟合的方法来描述不规则水果的形状等。柑橘外形美观, 是比较典型的球形或椭球形水果, 目前针对这类规则的球形水果进行外形分级的研究还比较少。在对柑橘的形状分级进行研究中, 提出了一些适用于实时生产的分级特征参数, 为实现柑橘水果的机器视觉分级提供依据。

但是目前国际上普遍采用柑橘的形状特征选取方法为对其进行圆度算法检测, 取得了较好的实用效果, 越趋近于一个圆, 其外形品质越好, 但是纽荷尔脐橙的外形并不是一个圆球形, 而是一个椭球形, 越是椭球形越是好品质的纽荷尔脐橙, 在图像上反应为一个二维椭圆。所以笔者认为用圆度算法检测纽荷尔脐橙并不合适。

2 图像预处理及传统特征参数选取

一般的柑橘分级系统是通过对用CCD摄像机获取的二维图像进行颜色转换 (由RGB模型转为HSI模型) , 提取I分量, 并二值化等预处理后, 分析提取分级特征参数。分级特征参数中关于形状的特征参数, 一般是选取长宽比、曲率、圆度、最大宽度、最小宽度等, 通过统计法或人工神经网络学习产生识别模型。

柑橘一般是球形水果, 其外形和标准球的接近程度是一个基本的形状特征。根据分级系统的生产特性和国际柑橘鲜果标准, 提出采用圆度作为形状的特征参数, 以此来对柑橘的外形做出准确的定义。圆度参量这个概念参考了机械零件的行位误差项目。国家标准中圆度误差的概念是这样定义的:指轮廓误差曲线上离圆心最远一点到圆心的距离与离圆心最近一点到圆心的距离之差。由于机器视觉系统识别的是采集到的柑橘图像, 外形和标准球的近似程度体现在二维空间:即为柑橘投影图像和标准圆的近似程度。常采用圆度参量作为特征参数描述柑橘的投影面积与标准圆的差异度。

3 几个典型的圆度参量的计算方法

在机械零件的形位误差计算中圆度通常采用以下几种方法进行计算:

3.1 最小二乘圆法

最小二乘圆也称平均圆。当轮廓误差曲线上各点到某一圆的距离平方和为最小时, 该圆即为最小二乘圆。设曲线上某点到该圆心的最大距离为Rmax, 另一点到圆心的最小距离为Rmin, 其最小二乘圆圆心至轮廓的最大距离之差即为圆度误差Rmax-Rmin。被测实际轮廓上各点至最小二乘圆圆心的距离的算法较为复杂, 计算量大。

国家标准中有一条关于形位误差的规定, 要求被测实际要素对其理想要素的最大变动量为最小, 即最小条件。最小二乘圆方法不符合最小条件评定准则, 不能满足高精度评定要求。

3.2 最小外接圆法

最小外接圆是指包容实际轮廓时, 即包容轮廓曲线的最小圆。最小外接圆法是以与实际轮廓相接触的最小外接圆作为圆度误差的评定基准, 其圆度误差值为外接圆半径R与实际轮廓上各点至最小外接圆中心的最小半径Rmin之差, 即

f2=R-R min

柑橘生产线是实时生产线, 要保证一定的生产率, 所以要在系统精度许可的范围内采用快速的分级算法。最小外接圆方法计算复杂、速度慢。

3.3 最大内切圆法

最大内切圆是指内切于被测实际轮廓, 或内切于轮廓误差曲线, 且半径为最大的圆。误差曲线上某点到该圆的最大距离即为被测轮廓的圆度误差。该方法主要用于评定内表面的圆度误差。

3.4 最小区域法

最小区域法是用两个同心圆所组成的圆环包容实际轮廓。包容时, 至少应有内外交替四点接触, 这样两同心圆的半径差为最小, 该半径差即为此轮廓的圆度误差。如图1所示, 圆度误差最小区域的判别方法为:两同心包容圆至少应与被测实际轮廓成内外交替的四点接触。即:最小包容圆上的两接触点的连线与最大包容圆上两接触点的连线相交叉

圆心到轮廓线最近的距离是同心圆的内圆半径R2, 外圆半径为最小外接圆的半径R1, 最小区域法圆度误差为:

f2=R1-R2

根据定义可以看出, 最小区域法是最符合国家标准中关于最小条件的规定的圆度评价方法, 评定的形状误差值是最小值。最小区域法也需要求取圆心, 计算量也很大。如果用在柑橘分级系统中采用这种方法, 虽然能够保证精度, 但是会大大的降低分级的生产率。

3.5 面积周长比

在相同面积条件下, 柑橘图像的边界越光滑, 形状越接近圆形, 周长越短。反之则周长越长。根据这个原理, 可以用面积周长比来作为柑橘的圆度描述特征参数f2。

undefined

面积周长比是一个比较常用的概念, 但是如果直接用柑橘的面积和周长相比, 结果会受到柑橘大小的影响。为了消除尺寸大小对圆度的影响, 用改进的面积周长比法计算圆度:

根据圆的面积和周长公式:

S=πr2 C=2πr

对圆度如下定义:

undefined

投影面积周长比表示圆度, 圆度值的范围只能在[1]) 之间取得, 更有利于用户分级操作。根据面积周长比的圆度定义, 柑橘的投影形状为圆形时, f2值可取最大值1;柑橘形状越远离圆形, f2越小。在求取大小时选用了投影面积法, 面积直接使用柑橘大小时获得的总象素数;柑橘周长为边缘序列点集 (xi, yi) 的总点数。采用这种方法通过简单的统计和计算就可以得出圆度的结果, 能够提高运算速度, 有利于生产效率的提高。

4 弦长比值法检测图像形状

目前国际上普遍采用柑橘的形状特征选取方法为对其进行圆度算法检测, 取得了较好的实用效果, 但是纽荷尔脐橙的外形是一个椭球形, 越是椭球形越是好品质的纽荷尔脐橙, 在图像上反应为一个二维椭圆。所以用圆度算法检测并不合适。只能采用其他的方法解决纽荷尔脐橙的外形检测。

因为在实际的图像拍摄中, 纽荷尔脐橙的位置可能会出现如图2:

果径与x轴方向 (生产线方向) 不平行的情况, 对这种情况可以通过图像的旋转达到x轴方向平行的效果, 但这种方法加大了计算的量, 不利于快速的检测。所以本系统设计了一个V形槽式的生产线。如图3:

就能够很好的解决拍摄中的果径与生产线不平行, 位置无法固定的问题。

由于圆度检测不适合椭圆型状的纽荷尔脐橙检测, 故采用椭圆弦距与果径的比值相对固定来检测形状, 如图4:

首先对图像预处理, 扫描到果径的两个端点A和A', 求出果径L的长度 (A与A'的距离) , 然后将L平均分为n等分 (n为奇数) , 等分点分别为C1、C2、C3、C4、C5、……、Cn;求出C1、C2、C3、C4、C5、……、Cn;的坐标, 通过Ci点与果径 (AA') 垂直方向 (y轴) 的延伸与果实外形交于两点, 求出两点的距离di, 由此产生一组数据d1、d2、d3、d4、d5、……、dn。在本系统中通过二值图像对Ci点纵向扫描得到的像素值的和替代di, n值的取值可根据实际情况确定, 如果对果形要求严格一些, 就将n值取大, 即增加等分点;如果要求不高, 则减少等分点, 可取小n的值。

同理:如图5, 也可用此方法求出在x轴方向椭圆的弦长dj', (j=1, 2, 3, ……, n) , 得到一组数据, 和前数据di, (i=1, 2, 3, ……, n) 一构成一个网状结构。就能更精确的检测果形。本系统中, 由于是快速检测, 所以只取了如图4的方法进行检测。

由于纽荷尔脐橙为平面图像为椭圆, 不管果实大小, 其d1、d2、d3、d4、d5、……、dn与果径的比值相对固定, 为了实现其比值相对固定, 可用一组数S1、S2、S3、S4、S5、……、Sn且 , 其中i= (1、2、3、4、…、n) 用自组织神经网络将S1、S2、S3、S4、S5、…、Sn作为样本进行训练, 产生识别模型, 从而达到快速检测果实形状的目的。

5 自组织神经网络SOM

在大脑处理信息的过程中, 聚类是其极其重要的功能。大脑通过聚类过程从而识别外界信号, 并产生自组织过程。依据大脑对信号处理的特点, 在1981年, 芬兰学者T.Kohonen提出了一种神经网络模型, 使得输入信号可以映射到低维 (如二维) 空间, 且保持相同特征的输入信号在空间上对应邻近区域, 该神经网络模型被称为自组织特征映射模型SOM (Self-Organizing Feature Map) , 也称Kohonen模型。该网络网络引入了拓扑结构, 并进一步引入了变化邻域概念来模拟生物神经网络中的侧抑制现象, 从而实现网络的自组织特性。SOM网络会自动将将差别很小的点归为一类, 是一种具有聚类功能的神经网络。因篇幅的原因笔者就不在此赘述。

利用SOM神经网络对纽荷尔外形进行分级, 50个供应来源多样化、尺寸大小不同、外形各异混处的脐橙试验样本被选取, 用来开展基于SOM神经网络的形状分级试验。

由上节得到的样本n个弦长比 (S1, S2, S3, …, Sn) 作为n维特征向量的SOM神经网络的输入, 神经网络的输入层由n个神经元组成, 其个数与脐橙样本的特征向量的维数相匹配。选用一维的SOM神经网络分类器, 其输出层 (竞争层) 输出神经元的结点数根据脐橙样本要分的等级数来确定。我国的脐橙检测与分级国家标准尚未出台, 可在实际操作中, 找出同一个批次的纽荷尔脐橙中能代表这一批次的脐橙作为样本。

根据SOM神经网络学习的特点, 50个脐橙试验样本均作为网络学习的样本集, 样本集中的脐橙样本经过图像采集、预处理、图像分割、二值化、求取弦长 (d1, d2, d3, …, dn) 、计算出弦长比 (S1, S2, S3, …, Sn) 等处理过程, 组合成一个n (本实验中取n=7) 维向量输入SOM神经网络, 对神经网络进行训练。网络被训练10000次之后完成训练过程。

在SOM神经网络训练完成之后, 把全部50个脐橙试验样本重新输入神经网络进行形状分级。每一个分级的脐橙试验样本被输入网络, 它们各自找到自己的获胜神经元, 若干个找到同一个获胜神经元的试验样本则被聚成同一等级。脐橙分级试验的结果被显示于下表中。测试结果表明, 运用SOM神经网络对纽荷尔脐橙进行形状分级 (实验中分为优等、合格和不合格两类) 的精度与人工分捡的误差率为6%。

6 结束语

为了探究用机器视觉技术和神经网络对脐橙形状进行检测与分级的速度和实时性, 在Matlab编写的程序中加入计时的程序代码段, 从图像分割、边缘检测, 到提取出7个弦长, 计算弦长比再到输入SOM神经网络进行形状分级所需的离线处理平均时间约为0.31秒。具有较好的实用性, 并且这种方法也能用于其它的椭圆物体的形状检测。本文的研究能够给水果的外观检测、促进其实现标准化带来一定的帮助, 也算是对“三农”问题的支持、城乡统筹一体化做一点贡献。

参考文献

[1]徐娟, 汪懋华.图像形态学在苹果自动分级视觉信息处理中果梗判别与边缘检测中的应用[J].2002, 15 (2) :177-180

[2]应义斌.水果性状的傅立叶描述子研究[J].生物数学学报, 2001, 16 (2) :234-240

[3]国家机械工业委员会.形状和位置误差检查与测量[M].北京:机械工业出版社, 1990

[4]李岚, 周大帅.圆度误差测量的数学模型及数据处理[J].佳木斯大学学报 (自然科学版) , 2002, 20 (2) :244-246

[5]郑鹏, 侯伯杰, 曹智军.圆度误差置换算法的研究[J].郑州大学学报 (工学版) , 2002, 23 (4) :107-109

基于视觉的人体识别概述 篇6

我们在信息大爆炸的年代, 以视频图像为主体的信息以指数量级进行增长, 并在运动分析、智能家居应用等领域广泛迫切需要使用计算机辅助或者替代人的视觉和思维, 处理图像视频中的目标识别和跟踪任务。由于日益扩大的需求而迅速发展, 基于视觉的人体识别技术已经成为计算机视觉以及人工智能研究领域的一个热点。

2研究背景及意义

人体识别是利用视觉信息实现自动识别人体运动行为的过程。基于视觉的人体运动行为识别技术的应用非常广泛, 同时具有非常可观的经济价值, 是当前热门的研究方向。主要包括智能视频监控、运动分析、智能家居应用、虚拟现实、用户接口等多个方面。

2.1智能视频监控:利用人体识别技术构建智能监控系统, 通过智能视频分析技术对重点区域内的异常行为进行追踪并发出预警, 避免犯罪和有关损失的产生, 广泛应用于人群集中或敏感区域, 例如银行、ATM自动存取款机、停车场、超市、码头等。

2.2运动分析:应用于体育项目及临床医学中。在体育项目中捕获正确的行为识别运动分析, 提高他们的训练效率及运动水平。另外, 运动分析还应用于病人的康复训练, 为临床提供科学准确的诊断评价手段。

2.3智能家居应用:针对独居老人或患病老人, 进行室内活动行为监控, 并进行分析。实时检测老人的异常行为, 例如跌倒或卧床未起等情况, 并准确及时地向监护人或社区医护人员发送警报。

2.4虚拟现实:是一种全新方式, 例如模拟驾驶、科幻片中的场景、虚拟现实游戏。

2.5用户接口:传统的输入设备, 如鼠标、键盘, 已被人体的某些动作所代替, 如手势、指纹、面部识别。

2.6在汽车行业中, 高科技配置参数描述的安全气囊自动控制系统、主动刹车系统、驾驶者睡眠检测系统、偏离车道预警系统, 都是人体识别技术的应用, 在新兴领域中的航拍图像、受害者营救等方面具有广泛的应用。

3人体识别技术的构成

人体识别是基于统计的模式识别技术应用, 由运动人体检测、运动行为特征选择和提取、人体运动行为识别构成。

3.1运动人体检测, 即为人体行为的特征提取做准备, 是在视频中准确快速地将运动人体从图像中分割出来。运动场景的复杂性及强光环境照射下阴影的干扰是人体检测的难点部分。目前运动人体检测主要的方法:光流法、帧间差分法、背景减除法等等。

3.2运动行为特征选择和提取, 即选择和变换运动人体检测后的图像序列, 以尽量少的特征向量维数来对运动行为尽量完整表述。主要有两种方法, 一是人体运动轨迹相关特征、二是运动人体图像区域特征。

3.3人体运动行为识别, 即是使用运动行为的特征向量对其进行分析分类, 利用基于人体模板的模板匹配、基于概率网络模型等方法, 得到其自然语言描述。

4行为识别的分类技术

基于行为表征的所建模型, 获取行为特征, 对行为进行分类, 根据行为特征实现行为的分类。用到的分类器为:直接分类法、状态空间分类法。

4.1直接分类法:不考虑图像序列内的时间关系, 直接将单帧图像或图像序列转换为特征向量后进行行为的模式分类。近几年来, 研究人员广泛关注支持向量机 (Support Vector Machine, SVM) 和相关向量机 (Relevance Vector Machine, RVM) 的研究及其应用。SVM是一种机器学习方法, 其建立在VC维 (Vapnik-Chervonenkis Dimension) 统计理论基础上。SVM已经成为小样本行为数据学习的重要方法。

4.2状态空间分类法:把每种静态姿势都对应定义成一种状态, 各种状态间的变换满足一定的概率关系, 将运动序列看成不同状态间的遍历过程, 计算遍历过程所对应的联合概率, 并将最大值作为行为模式分类的依据。状态空间分类器可进一步划分为两类:生成式分类器和判别式分类器。4.2.1隐马尔可夫模型 (Hidden Markov Model, HMM) 是最具代表性的一类生成式分类器。在文本识别、人脸识别等多个研究领域被广泛应用。4.2.2动态贝叶斯网络 (Dynamic Bayesian Network, DBN) 被看成是HMM的推广。其原理为在每一个时间片上都对应一个贝叶斯网络, 且每一个状态变量均可对应多个因果节点。4.2.3条件随机场 (Conditional Random Field, RCF) 是基于最大熵模型、HMM模型, 提出的一种判别式概率无向图学习模型。4.2.4动态时间规整法, 对于同一个行为, 不同人执行的时长可能不一样, 通常采用动态时间规整 (DTW) 方法, 通过建立一个最佳的时间规整函数, 使得二者在时间长度上达到一致。

5存在问题及展望

在人体识别领域, 未来还可以研究的方向包括:

5.1多摄像机的能提供多个方向的视频序列。使用多角度的视频可以解决人体被遮挡的问题。

5.2多角度的动作识别。摄像机的拍摄角度会影响到人体行为识别的正确率。

5.3多种行为特征的融合。由于在不同的环境中, 各种算法对人体行为的特征的提取也不相同, 怎样把多种行为特征进行融合, 找出更本质上的描述人体行为的特征, 与其他学科相结合, 需要深入的探索。

5.4人体行为分析的理解与描述。目前对人体行为识别的语义理解还相对简单, 如何借助人工智能、计算机视觉算法等领域先进的成果, 实现复杂场景下的自然语言描述。综上所述, 人体识别的研究任重道远。在借助先进的硬件设备, 不断完善的视觉算法, 充分利用人工智能、机器视觉等领域的研究成果, 将现有的简单的人体行为识别技术, 推广到复杂场景下的高层次的人体行为识别, 建立能实现自动完善、具有主动学习能力的实时的智能系统, 是科研人员研究的终极目标。虽然人体识别的准确率和速度仍在不断的提高, 但是距离目标还有一段路要走。

参考文献

[1]冯莲, 邹北骥.基于视频的人体运动跟踪技术研究[D].长沙:湖南大学, 2006.

[2]王庆帅, 刘志镜.智能监控系统中人体行为识别技术研究与实现[D].西安:西安电子科技大学, 2010.

[3]倪洪印.基于视频的人体检测与目标跟踪方法研究[D].长春:吉林大学, 2014.

[4]赵运基.基于视觉的目标跟踪算法研究[D].广州:华南理工大学, 2012.

[5]井亮, 陈谋.基于视觉图像的移动目标跟踪技术研究[D].南京:南京航空航天大学, 2011.

环境视觉识别系统设计分析 篇7

在环境视觉识别系统设计中, 主要包括三个部分的内容, 即视觉识别、环境行为识别以及环境理念识别等。它主要是通过组织化、系统化的视觉识别方案, 传达一些区域行为内容, 如精神、价值以及相关思想等, 从而达到掌握区域信息的目的, 这种环境视觉识别系统的认同感相对较强。在对环境视觉识别系统进行设计的过程中, 主要渠道则是打开视觉信息, 同时结合人们的实际心理需求以及精神需求等, 全面提升环境形象的影响效果, 从而达到增强区域内环境竞争力的目的。

二、环境视觉识别系统设计的原则

(一) 构思深刻

在环境视觉识别系统设计中, 首先应遵循的原则就是构思必须深刻。要全面突出区域的本底性, 并且要将区域的实际内在需求以及识别的功能特点全面抓住, 同时充分揣摩区域环境的题材内容, 这样就能通过精炼的手法以及巧妙的构思, 全面突出区域环境主题性的相关内容。

(二) 生动形象

在设计环境视觉识别系统时, 还需确保其具有生动的形象。为了全面突出区域的特色效果, 在构造视觉语言的过程中, 还需要提升其传播的效果, 这样才能将区域环境识别的独特性充分、全面地展示出来。

(三) 创新性

在进行环境视觉识别系统设计的过程中, 还必须具备一定的创新性。在对区域环境发展活力进行展示的过程中, 最关键的就是将区域环境中标志性的景观展示出来。同时在设计环境视觉识别系统的过程中, 树立“以人为本”的设计理念, 并严格按照美学的基本原则, 充分体现出区域环境的感召力, 这样才能将环境识别的效果具体地传达出去。

三、环境视觉识别系统设计的内容流程

(一) 识别符号的设计

在设计环境视觉识别符号的过程中, 首先需要明确环境区域的名称以及标志等重要内容, 并且确保其具有一定的精神内涵和意念, 同时确保整个环境区域象征具有一定的整体性, 这样就能按照人们心理的实际需求, 对图文进行合理的组合。在设计应用要素的过程中, 首先需要对总体进行合理的规划, 而在建筑系统布局的过程中, 需要合理地设计和划分应用要素。同时在设计结构模式的过程中, 要通过相对集中和统一的设计, 对一元化的结构模式进行合理设计, 而这种模式主要应用在较小的环境区域中, 且在知名度较低以及经济实力较弱的环境区域中, 具有非常好的适应性。而对于多元化的结构模式而言, 其视觉方面的设计具有很大的不同, 且不同的环境区域, 其设计以及标志等也具有较大的差异。另外, 对于混合结构模式而言, 其不仅具有多元化结构模式的基本特征, 同时也具有一元化结构模式的基本特征, 它主要采用的是分区名称与统一标识相结合的方式, 从而设计出一种环境视觉识别系统。

(二) 视觉形象的设计

在设计环境视觉识别系统的过程中, 对于设计视觉形象区位以及空间结构来说, 主要是通过人们视觉的基本理论, 对环境区域中一些关键的视觉区位进行相应的设计, 例如地标区以及出口通道等, 从而确保区域形象的鲜明性。通过地域要素来构成区域形象, 就能确保设计的环境区域具有一定的连续性和统一性。在设计标志性区域景观的过程中, 需要按照区域形象的参照感知体系, 合理地整合和布局环境区域景观, 并按照民族精神的主要理念以及时代发展的基本主体, 全面地反映出环境地域的人文特性以及鲜明性。

(三) 作业的规范设计

在对作业规范进行设计的过程中, 要根据环境视觉识别系统中的符号面, 合理地设计和布局平面, 并在环境视觉形象设计的景观中, 将设计的三维空间特点充分体现出来, 这样才能确保区域设计意境的具体化。而在开发视觉意境美的过程中, 还要进一步提炼形象设计中的关键点, 并使其转变成具体的设计理念。而在设计当前城市规划以及发展的过程中, 还要通过充分的论证, 将形象风貌的具体特征充分体现出来, 这样才能确保环境视觉识别系统的设计具有良好的意境美。

综上所述, 环境视觉识别系统的设计, 不仅能够提高环境区域的综合效益, 同时还能促进社会经济获得良好的发展。因此在进行环境视觉识别系统设计的过程中, 必须按照时代发展的趋势, 采取有效的措施增强视觉语言的传播效果。

摘要:随着社会经济的飞速发展, 人们对于精神上的需求以及视觉上的感受也有了更高的要求, 因而人们对环境构造的要求也越来越高。而在环境视觉识别系统设计的过程中, 树立“以人为本”的设计理念, 就必须高度重视人们的心理感受以及心理需求。因此对环境视觉识别系统设计进行深入的研究, 分析了环境视觉识别系统设计的内涵及原则, 从而对环境视觉识别系统设计的内容和流程做了详细的阐述。

关键词:环境视觉识别系统,内涵,原则,设计流程

参考文献

[1]袁筱.视觉导向系统在环境设计中的应用[D].景德镇陶瓷学院, 2013.

[2]王璇.高速铁路车站视觉识别系统设计研究[D].南京师范大学, 2012.

[3]陈楠.2014年索契冬季奥运会多面性视觉识别系统设计分析[J].艺术设计研究, 2014 (1) :86-90.

新闻网页的视觉识别系统设计 篇8

当今世界的网络事业正处在一个迅猛发展和普及的阶段, 网民数量的急剧增加、网络涉及民众日常生活的愈发广泛、网站建设的不断蓬勃、网页内容的高速更新, 使网络已经成为了很多人的一种生活方式。在互联网新闻传播方面, 网络平台可以为人们提供最快最全的新闻信息, 形式多样, 丰富多彩。因此, 在电视、广播、报纸等传统媒体之外, 越来越多的人们已经习惯于通过网络浏览新闻。尤其当重大事件发生时, 网络搜索新闻的随时和便捷性更为受众所青睐。但在信息爆炸的时代, 新闻网页的设计者要想争取更多的点击率, 在保证新闻内容优质的前提下, 还必须要打造自己独特的品牌风格。调查显示, 有高达67%以上的网民倾向于在固定的网站浏览新闻, 而这其中59%以上的受调查者选择固定网站的原因是“页面让人觉得舒服”。由此可见, 高质量新闻网页视觉识别系统的建立非常必要。由于品牌视觉识别系统是一个完整的系统工程, 涉及的范围很广, 这里着力从新闻网页设计的标志系统设计、色彩设计、字体设计三个方面进行分析。

1 新闻网页设计的标志系统设计

新闻网站的标志无疑是整个视觉系统设计中最关键的一部分, 它作为设计中的核心, 若能给浏览者留下深刻的印象, 服务于品牌传播的同时, 将直接关系到网站的经济效益。不同种类的网站新闻页面, 有着各自不同的视觉识别系统设计方式, 主要分为两种类型。一是传统报纸媒体、传统电视媒体和传统广播媒体的网络版形式, 另一类就是商业综合网站的新闻频道。由于传统媒体在社会中已经有了固定的受众, 也具备着相对广泛的影响力, 多平台中的统一标志也有利于品牌传播, 所以传统媒体的网络版新闻页面标志设计也多会沿用已使用的标志。如人民网沿用的是《人民日报》的字体和颜色, 以“人民网”三个字的书法为网站标志, 凤凰网直接沿用凤凰卫视抽象的凤凰旋转交融的形象台标。除了几乎完全直接沿用的媒体, 也有对网络标识进行全新设计的, 比如新华网的网络标志变成了中英文相结合的设计。与此差别较大的是, 一些综合商业网站的标志设计充分体现了互联网传播时代的多样性, 生动、灵活、时尚, 极具个性化。其中百度的标志设计最为活跃, 不仅有一般情况下使用的最具识别力的标志, 在节日、纪念日等有意义的日期到来之际, 会在与本来标志相统一的基础上设计与节日氛围相适应的新鲜标志样式。再比如腾讯网红黄绿三色环绕着一只小企鹅的标志设计, 同样很有意义。环绕QQ企鹅的三种颜色代表腾讯网为公众提供的三个创新层面:绿色, 表示通过学习型创新, 提供日新月异生命力蓬勃的产品;黄色, 表示通过整合创新, 提供温暖可亲的多元化互联网服务;红色, 表示通过战略创新, 倡导年轻活力, 创意无限的生活方式。标志设计独具创造性的同时, 腾讯公司的企业文化也尽在其中。

在与商业网站的对比中我们看到, 我国的新闻网页的标志设计对于互联网优势的体现还是很欠缺的, 新闻网页设计者应该在把握市场动态, 对网民的喜好倾向进行分析的基础上, 把互联网相对于传统媒介在图形与色彩上的变化优势充分体现出来。

2 新闻网页设计中的色彩设计

不同颜色会给予人不同的心理感受, 当网页映入浏览者的眼帘, 它的颜色便会直接影响他们对该网站的第一印象。因此, 色彩设计在网页视觉识别系统设计中是举足轻重的关键环节。蓝、深红、灰、黑是目前各大网站中最常见的颜色。蓝色这种代表理性的冷色调可以一定程度上的体现新闻的真实性, 新闻网首页的新闻小标题中用得较多。红色辨识度最高, 传播速度最快, 在新闻网页设计中多用在栏目板块或标题上, 使所表现的内容很容易被捕获。但是腾讯网、人民网、新华网等诸多网站中, 其标题字设计为均蓝色或者黑色, 并没有滥用红色, 这是因为红色易引起视觉疲劳, 不利于长时间阅读。

3 新闻网页中的字体设计

与图片的功用比起来, 文字表意明确, 是新闻网页构成要素中的主体, 虽然图片常常更加吸精, 但是网民获得新闻信息的最主要形式仍是通过文字。黑体和宋体作为传统媒体中最常用的两种字体, 同样被使用在新闻网页中, 略有不同的是, 计算机中黑体和宋体选择更加灵活多样。黑体字是一种装饰字体, 笔划整齐划一, 醒目有力, 识别性高, 常被选作要点新闻、或者新闻大小标题使用的字体。模仿宋体字结构和笔意的仿宋体, 笔画粗细一致、秀丽狭长, 适合阅读, 也同样适合印刷, 在新闻网页的段落中被广泛使用。在字体大小方面, 浏览腾讯网、人民网、新浪网等大型网站可以发现, 9磅和12磅左右的字体使用较多, 通常分别作为新闻网页的标题和正文, 或者分别作为需要强调的地方和辅助内容。

在信息高速发展的今天, 新闻网站要想获得更多的认可, 必须加强视觉识别系统的设计改革, 打造全新的网站, 为用户提供更好的体验。

摘要:不同于商业网站对品牌形象经营的注重, 现有的很多新闻网站的建设基本是传统媒体网络版, 少数权威新闻媒体单纯从新闻内容上赢得点击率, 并没有很好地利用网络媒体的独特优势。当前网络信息铺天盖地, 新闻网页设计应该关注网页最直观感受形式, 重视视觉识别系统的设计, 从而彰显媒体自身的理念, 吸引网络受众的眼球。

关键词:新闻,网页设计,视觉识别,媒体

参考文献

[1]刘俊荣.基于行为识别的网页文本分类算法研究与实现[D].北京邮电大学, 2010.

[2]宋鳌.网页去噪在交互电视中的应用与研究[D].上海交通大学, 2011.

[3]彭聪.一种在移动网络环境下的网页排序算法的研究[D].湖南大学, 2010.

上一篇:网上服务利用下一篇:理财产品问题