标识识别(精选6篇)
标识识别 篇1
增强现实[1](Augmented Reality,AR)技术是在虚拟现实(Virtual Reality,VR)技术上发展起来的一门新兴技术,该技术用于生成一个虚、实结合的环境,在这个环境中,计算机生成的各种信息被用于增强或补充用户所在的真实环境,同时用户可以通过各种方式来与虚拟物体进行交互。由于其广泛的应用背景,成为近年来的一个研究热点。
要实现虚拟和现实的完美结合,必须将虚拟物体准确地融合到现实世界中的相应位置上,这个过程称为注册。其中基于标志点的增强现实三维注册技术是利用计算机视觉技术来计算观察者相对于标识点的位置,方位和姿态,从而实现对标志点的跟踪与定位,将需要叠加的虚拟物体正确叠加在标识点上,实现对现实场景的增强,并实时显示增强后的效果。其中,对标志点的识别是整个增强现实系统的基础。
本文利用FPGA实现了人工标识识别的系统开发,对TRDB - D5M摄像头采集到的含有标识的图像进行相关的图像处理,实现了对标识区域和标识图案的识别。
1 系统的总体框架
1. 1 标识的选择
合理选取标志图案可以有效地降低技术实现的难度,所以在标识的选取过程中,为便于识别和分析需要满足以下两点要求[2,3,4,5]:(1)能被摄像机清晰地采集到,易于识别以及辨认。(2)具有规则的几何外形和鲜明的色彩特征,并以简单图形为佳。
在数字图像处理中,黑白颜色较易区分,正方形提供同平面的4 个角点,而且形状简单,易于识别,因此大多数AR人工标识选取黑色矩形框作为基准标识[6]。且为了区分标识,其内分别有简单图形,本文基于ARToolkit[2]中的标识,选择如图1 所示的含有图片模板的标识。
1. 2 系统硬件结构设计
设计构建的增强现实人工标识识别系统的整体框架如图所示,其中视频采集显示系统主要包括CMOS图像传感器摄像头、FPGA核心控制单元以及VGA显示单元。标识识别系统则由视频处理模块组成,主要完成视频图像在图形学上的算法处理。整个硬件系统实现图像的采集、接受、存储以及输出显示等功能,主要由数据获取单元、格式转换模块、I2C控制器、SDRAM、VGA控制器和VGA数模转换器模块构成。
如图2 所示,左边是TRDB - D5M摄像头设备和它的控制电路,通过采样和A/D转换输出可被处理的数字视频信号,其中,摄像头通过I2C总线进行配置,从而控制它的工作模式。它们之间的传递信号主要是SDA和SCL。FPGA模块主要完成输入输出设备的配置、控制等功能,以及完成输入到输出数据的传输和处理功能,是本设计的核心部分。其中,主要包括CMOS传感器数据获取单元、图像类型转换单元、VGA、I2C和SDRAM控制器等模块。CMOS传感器数据获取单元负责接收摄像头输出的视频数据。图像数据转换模块主要将获取到的原始Bayer型图像格式转换为RGB格式,并通过SDRAM控制器将转换后的图像缓存进SDRAM,最后VGA控制器产生行场同步信号并将数据输出,再通过A/D转换后送给VGA显示。
1. 3 I2C总线工作原理
设计中I2C总线[7]主要应用在TRDB - D5M摄像头的配置上。控制单元通过I2C总线和摄像头通信,修改其内部寄存器。直接关系到摄像头的工作参数,如曝光时间、像素时钟、分辨率等。
I2C总线主要通过主器件寻址从器件,并传输数据,并由主器件终止数据传送,其中数据传送协议如下所示:
(1)在数据传送过程中,必须确认数据传送的开始和结束。开始和结束条件定义如图3 所示。
当时钟线SCL为高电平时,数据线SDA从高电平向低电平跳变表示开始条件,而从低电平向高电平跳变表示结束条件。
(2)I2C总线数据传输是必须遵循总线协议所规定的数据传输格式,如图4 所示。
开始条件产生后送出的第一个Byte数据为从器件的地址,每发送完一个Byte后都要求接收方发回一个应答信号。主器件在接收应答信号之前必须先释放对SDA线的控制,以便从器件在这一位上发出应答。数据传输完毕,从器件发回一个非应答信号,主器件据此产生结束条件。
2 人工标识识别算法及FPGA的实现
为获取模板标识以便于后期将虚拟图像叠加在标识上,必须通过图像处理的方法分离出实时图像中的标识区域,将其与模板匹配完成对标识的识别。该模块的工作流程如图5 所示。
2. 1 图像的格式转换
TRDB - D5M摄像头输出视频色彩格式为拜耳型(Bayer Pattern),这种格式的图像数据在后期处理以及显示操作时不方便,因此需要通过图像格式转换模块将Bayer型转换为常用的RGB型。
转化的基本原理是根据像素周围已知颜色分量进行插值,估算未知的颜色分量[8]。从理论上来说,插值方法越简单,得到的图像质量越低,处理时间越短;反之,质量越高,时间越长。因此,在实际的应用中,选择适当的方法,在图像质量,处理速度以及资源利用方面起到重要的作用。本文基于3 ×3 插值算法利用FPGA实现了图像的转换。此方法的基本特征是“平均”。在估算缺失的颜色分量时,选择一个3 ×3 邻域,根据邻域内相同颜色分量值,使用双线性插值算法计算平均值实现色彩还原。该方法简单,在图像平滑区域可以收到较好的还原效果[9,10,11]。3 ×3 邻域示意图如图6 所示。
B5处像素的R、G、B分量的计算公式如下
而G7处像素的R、G、B分量的计算公式为
2. 2 灰度处理
在对图像进行二值化处理之前,首先对彩色图像进行灰阶处理,将R、G、B这3 个分量以不同的权值加权平均得到合理的灰度图像,其算法有式(7)所示[15]
由式(7)可以看出,R、G、B是影响灰阶的3 个分量,且G的权重最大。如图7(a)为转换后的RGB图像,图7(b)为灰度图像。
2. 3 二值化处理
在对图像进行二值化处理时,本文采用固定阈值的方法来完成这一操作:当图像f(x,y)处的灰度值小于阈值T时,就把该点作为图像的背景,以“0”表示,否则,以“1”表示。而阈值的选取尤为重要,适当的阈值能消除光照所带来的影响,在这里阈值选取为128。图像f(x,y)经过二值化处理后,输出的二值图像g(x,y) ,其算法公式如公式(8) 所示[14]
处理后的二值化图像如图8 所示。
2.2标识识别
2.2.1标识区域的识别
在一幅含有人工标识的二值化图像中,由于标识的周围存在着大量的干扰信息,这需要对标识域进行提取:首先检测标识的外框,然后在外框的区域里搜索特征点,即标识图案的识别。
本文采用对该二值图像进行连通域分析[16],先对图像进行逐像素扫描,完成对图像的分析,对于闭合的边缘,找出其中所有的四边形区域作为候选匹配区域,对于非闭合或者太小的边缘,则被直接丢弃,并确定候选区域的4条边的位置。
2.2.2标识图像的识别
在检测到标识的外框后,就要在外框的区域内搜索特征点,从而匹配相应的虚拟信息。论文中采用了模板匹配法[14-16],该方法具有较好的通用性,可以识别多种类型的图案。
当成功检测到四边形,并且找到其4个顶点后,就要对每个校正后的候选区域进行模板匹配,已确认是否是预定义的目标标识。模板匹配的思想是将模板图片按照投影模型进行投影,得到标识投影图,再将投影图与摄像头拍摄到的标识图进行对照,计算两幅图像之间的相似程度。匹配接近的程度可借助向量的范数来描述,如欧几里得距离。对每个候选区域都有一个置信度,当接近程度大于此置信度时,则匹配成功,否则失败。
3结束语
本文基于增强现实技术,利用FPGA开发板实现了对人工标识识别的硬件系统,为移动增强现实系统的发展具有一定的实际意义。随着计算机硬件的发展以及增强现实系统应用越来越广泛地应用到各个行业,以及嵌入式系统的可移植性、便携性等特点,使其成为未来增强现实的主流应用平台。
标识识别 篇2
一、使用腕带作为识别病人身份的标识,严格执行“查对制度”,至少同时使用姓名、年龄或其他等2种方式核对病人身份,确保病人身份准确,诊疗操作无误。
二、急诊抢救病人、重症监护病房、介入手术、昏迷、神志不清、无自主能力的重症病人、语言交流障碍、镇静治疗,及有晕厥、低血糖、老年痴呆病史病人、年龄在70岁以上者均使用标识腕带。
三、入院时由当班接诊护士在腕带上用签字笔端正、清楚、准确地填写病人信息:病区、床号、姓名、性别、年龄、住院号、诊断。腕带书写要求正确、规范,腕带上患者的信息项目栏避免遗漏,字迹清晰、工整,无涂改。信息与病人家属一起核对,告知应用的意义及注意事项,核对无误后松紧适宜地佩带在病人左手腕部,如左手腕部是患处则佩带在右手腕部。向病人及家属告知不能随意取下,交代其用途及注意事项,直到出院时由当班护士取下后统一处理。
四、操作时要求三查七对,并查对腕带内容,患者转科和交接班、手术治疗、留取各种标本、输血治疗、放射及超声等检查时需准确识别,除检查病历、床号和呼叫姓名外,需查对腕带标识。
五、加强患者佩戴腕带部位的观察 如皮肤的完整性,有无擦伤、手部血运是否良好、松紧度是否适宜等。
六、患者出院或转科时方能将腕带标识取下;如因转科或特殊治疗等其他原因,必须取下或更换部位时,应重新填写并由2名护士双人核对后再次佩戴腕带,以确保患者标识准确。
七、关注重点环节的患者身份识别,细化识别流程。
(一)手术患者识别:采用“腕带”、“患者家属及陪护亲友”、“患者姓名、性别、住院号”识别。手术前一天由病房护士确认患者身份戴“腕带”,主管医生进行手术部位标记。手术患者核对:查对患者姓名、性别、年龄、病案号、诊断、手术名称、手术部位(左、右)等。接接患者之前:导管室护士与病房护士查对,进行患者姓名、性别、年龄、手术名称、手术部位的确认。进入手术间后:手术医生与导管护士共同与清醒的患者交谈查对,确认患者身份。
(二)输血患者身份识别:采用“腕带”、“患者家属及陪护亲友”、“患者姓名、性别、住院号”识别。根据医嘱、输血申请单,护士两人核对患者姓名、病案号并与患者核实后方可抽血配型。输血前需两人核对患者床号、姓名、住院号及血型(含Rh因子),检查采血日期、血液有无凝血块或溶血、血袋有无破裂、输血单与血袋标签是否一致,同时检查供血者的姓名、血型(含Rh因子)及血量是否相符,交叉配血报告有无凝集,无误后方可输入。
腕带的处理流程
1.入院(1)接待患者
(2)核对患者首页信息正确无误。(3).填写病人病历相关内容。
2.填写腕带表示链
(1)姓名,年龄,性别,住院号,诊断,科室,过敏史,对XXXXXXXX药物过敏)。(2)双人核对
3.确认腕带填写的各项内容给患者佩戴腕带并宣教(1)佩戴时要注意书写方向向外,松紧度能放进一手指。(2)宣教佩戴腕带的目的(确保核实该病人身份)
4.使用腕带查对确认患者身份
(1)让患者说出自己的姓名,并与腕带资料确认。
5.确认患者出院(1)结账
(2)确认完成治疗。(3)解除腕带,出院
患者身份识别制度
1、医护人员在各类诊疗活动中,必须严格执行查对制度,应至少同时使用姓名、性别、床号3种方法确认患者身份。
2、检查、CCU、病情危重、意识障碍、新生儿、围手术期、输血、不同语种或语言交流障碍等患者必须按规定使用“腕带”标识。
3、护士在为患者使用“腕带”标识时,实行双核对。“腕带”记载信息包括:患者姓名、性别、年龄、住院号、床号、科别、诊断、过敏史等。由病房责任护士负责填写。
4、护士在使用“腕带”作为识别标示时必须双人核对后方可使用,若损坏需更新时同样需要经两人核对。佩戴“腕带”标识应准确无误,注意观察佩戴部位皮肤无擦伤、血运良好。
5、介入治疗或有创治疗活动、标本采集、给药、输血或血制品、发放特殊饮食前,医护人员应让患者或家属陈述患者姓名,并至少同时使用两种患者身份识别方法,核对床头卡和腕带,确认患者身份。
6、在诊疗活动前,实施者必须亲自与患者或其家属进行沟通,严格执行查对制度,保证对患者实施正确的操作。
7、手术患者在转运交接过程中,必须有患者身份识别的如下具体措施:
(1)手术患者进入手术室前由病房护士给患者使用“腕带”标识,写清患者床号、姓名、性别、住院号、科别、血型后,与手术室护士交接并填写病房与手术室对接单,无误后方可进入手术室。(2)围手术期患者“腕带”使用时间必须依据护理部规定,即手术前一日开始使用,手术后病情危重期间使用(直至改为二级护理),手术后病情稳定使用三日,结束后由病房负责护士核对后取下。
8、病房、导管室、CCU之间患者识别,必须有患者身份识别的具体措施:
(1)病房与导管室转接患者:病房护士认真查对,做好手术前准备;认真与导管室护士进行交接,内容包括:床号、姓名、手术名称、生命体征、手术前准备、药物情况等,并填写病房与导管室患者对接记录单。
(2)导管室与病房转接患者:手术后由医务人员护送保证搬运安全,导管室护士认真交接按识别卡与病区做好病情、药品及物品的交接,内容包括:患者自然情况、术式、穿刺部位、鞘管、止血方式、意识等,填写导管室与病房患者对接记录单,无误后方可离开。(3)病房与CCU转接患者:由医务人员负责转送,保证搬运安全;病房护士认真交接,内容包括:意识、瞳孔、生命体征、输液、各种引流、皮肤完整情况等,填写病房患者与CCU对接记录单,无误后方可离开。
患者身份识别制度及重点环节的流程程序
1、患者身份识别制度由医务处、护理部、门诊部联合制定。
2、医务人员在给患者用药、使用血液和血液制品、采集血液和其他标本、为患者提供其他的诊疗操作之前均应对患者身份进行识别,准确无误后方可从事诊疗活动。
3、至少同时使用二种(或二种以上)患者身份识别的方法。
4、患者身份识别采用患者姓名、住院号和患者家属及陪护亲友识别,不得仅以床号作为识别的依据。特别注意在使用患者姓名进行识别时,要询问患者让患者回答,然后将患者的回答与手中的信息进行核对。
5、对所有来诊患者均要进行身份识别,相关工作人员有责任依据患者的身份证、户口本、医保卡等有效证件,在各种医疗文书、收款依据上准确填写患者的姓名、性别、年龄等。
6、无有效证件证明其身份的患者,接诊医师要求患者本人亲自填写姓名、年龄等;对暂时无法识别身份的患者要在病历上注明原因,待明确身份后再按病历书写规范补写。
7、严格执行查对制度,准确识别患者身份。在进行各项治疗、护理活动中,至少同时使用姓名、性别、床号三种方法确认患者身份。
8、进行介入或有创诊疗前,施术者要亲自与患者(或患者亲属)面对面沟通,并把沟通内容简明扼要记录在病历上。
9、医院要求各科对无法有效沟通(如昏迷、神志不清、无自主能力、新生儿等患者)及需要手术治疗的患者,建立使用“腕带”标识牌,作为住院患者的识别制度,在进行各项诊疗操作前要认真核对患者“腕带”上的信息,准确确认患者的身份。
10、“腕带”牌记载患者信息包括:科别、床号、住院号、姓名、性别、年龄、诊断等,由病房的值班护士负责填写。
11、要求所有重症监护室、急诊抢救室、分娩室(新生儿)、新生儿病房、所有进入手术室患者以及所有处于昏迷状态的患者均要佩带“腕带”牌,以便身份核对识别。
12、“腕带”牌上填写的患者信息必须经二人核对后方可使用,若损坏需更新时同样需要经两人核对。佩戴“腕带”标识应准确无误,注意观察佩戴部位皮肤无擦伤,血运良好。
标识识别 篇3
1 机器视觉系统的组成简介
一个典型的机器视觉系统由图像获取系统、图像处理、识别系统以及反馈控制系统等四部分组成[2]。由于机器视觉技术的应用非常广泛, 在各个系统中这四部分里一些特殊部件可能各不相同。但是主要的部件如下所示。
(1) 图像获取系统:将被测物体的可视化图像和内在特征转化成能被计算机处理的数据, 它主要由相机、镜头、光源传感器和图像采集卡组成, 分别如图1中1、2、3, 4所示。
(2) 图像处理:包括图像的编码, 传输, 图像增强, 图像分割和特征提取等。
(3) 分析和识别:分析提取的特征, 然后识别, 理解和分类等。
2和3这两部分经常是相互影响和包含的, 他们主要由主机和检测软件两部分组成, 分别如图1中5和6所示。
(4) 反馈控制 (即I/O及网络连接) :图1中7所示, 系统完成对一个部件的检测后与外部控制设备通讯, 将识别过程和分类结果反馈, 来控制制造或者机械手的操作过程。通常, 一个数字I/O接口卡和网卡组成了与外部设备及数据库的通讯连接。
综上所述对机器视觉系统进行设计, 需要有一些初始设计需要完成, 这些设计是为了获得较理想的源图像, 它们主要是:选择相机的类型、选择相机的位置、估计分辨率和速度、选择硬件处理选项、选择镜头、选择光源技术、选择图像采集卡和计划图像处理。
2 芯片标识识别的特点
芯片标识识别属于工业现场字符识别, 它综合了数字图像处理和光学字符处理的理论和技术, 它的基本原理与OCR技术类似, 但是现有的OCR技术并不能成功地应用于其中, OCR系统是通过扫描仪输入文本图像, 然后识别文字, 但是芯片的标识不是文本, 而是雕刻或喷射在工业部件上的字符, 采集的图像往往不够理想。在这种情况下, 多采用CCD摄像机获取文字图像, 由于标识字符不同于普通的印刷文字 (大多是白纸黑字) , 与背景具有较高的灰度差;也不同于汽车牌照, 有显著的颜色差, 它完全是依靠对光线反射的强弱来决定字符与背景的。由于工业现场环境复杂, 加上拍摄时光源可能的不均匀, 从而导致识别比文本识别困难很多;另外在线检测时, 芯片放置位置不唯一, 并处于传输状态, 实时获取的图像噪声大, 而且芯片表面常存在褪色、字符粘连和断裂等情况;对算法的耗时性也有限制, 需要选择速度快而且又准确的图像处理和字符识别的算法。
3 芯片标识识别系统的整体框架
一个典型的基于机器视觉的IC芯片表面标识识别系统由芯片检测、图像采集、芯片标识识别、信息存储等部分组成[3]。其系统构成如图2所示。
(1) 芯片检测一般有两种方式:红外触发和视频检测。它的作用是当待识别芯片进入CCD标定区域时能够被及时检测, 并且触发图像采集模块采集图像。
(2) 图像采集一般通过图像采集卡或者通过直接的数据总线 (如IEEE1394, USB2.0) 直接抓拍。
(3) 标识识别模块:是通过图像处理技术把采集的芯片图像中的标识字符识别出来, 它分为图像预处理、图像分割、字符识别等几个模块。
(4) 信息存储模块:主要用于根据存储图像及其信息, 以备以后查询。
摘要:本文详细介绍了机器视觉系统的组成, 并对基于机器视觉的芯片标识识别系统的特点进行了阐述, 最后对芯片标识识别系统的整体框架和构成作了一一介绍。
关键词:机器视觉,芯片标识,识别系统
参考文献
[1]李了了.工业现场字符识别方法的研究[D].合肥:合肥工业大学, 2003.
[2]关胜晓.机器视觉及其应用发展.自动化博览[J], 2005 (3) :125~127.
神经内科腕带识别标识管理规定 篇4
试行日期2014.11.1
修订日期2015.1.20
一、“腕带”使用目的
帮助医务人员确认住院病人的正确身份,提高识别准确度。严格执行“查对制度”,至少同时使用腕带、床头卡或其他等2种方式核对病人身份,确保病人身份准确,诊疗操作无误。
二、“腕带”信息内容
包括:科室、床号、住院号、姓名、年龄、血型、过敏史等。护理人员应用黑色记号笔按要求,逐项清晰填写各项内容。
三、“腕带”佩带部位:
腕带常规佩戴在病人右腕。如病人右腕无法佩戴时,按右腕—左腕的顺序依次佩戴。“腕带” 佩戴时注意字体方向,便于查对。
四、“腕带”佩戴时松紧度以1-2指为宜。佩戴部位皮肤保持完整、无擦伤,肢体末梢血运良好。
五、“腕带”管理要求:
1.病人入院后由主管护士或值班护士填写“腕带”上的信息,需由双人核对(白班主管和责任护士核对,夜班由值班护士2人或医护)核对无误后,由责任护士或值班护士为病人佩戴。2.责任护士应每天检查 “腕带”的信息是否清晰。一旦发现“腕带”损坏、丢失及“腕带”上信息无法辨认时,应立即更换,更换时同样需经两人核对无误后方可为病人佩戴。3.“腕带”不得重复使用。
4.每班检查患者“腕带”皮肤情况一次,保证佩戴部位皮肤完整、无擦伤、血运情况良好。
5.病人出院时由责任护士摘除腕带,双人核对后丢弃于感染性废物桶。
六、护士在标本采集、给药、输血或血制品等诊疗活动时要求三查七对,并查对腕带内容,应至少使用两种身份识别方法(腕带、床头卡),实行双向核对法:即要求患者或家属自行说出本人姓名,确认无误后方可执行,已确保对正确的患者实行正确的操作。
七、关注重点环节的患者身份识别,细化识别流程。
(一)手术患者识别:采用“腕带”、“患者家属及陪护亲友”、“患者姓名、性别、住院号”识别。手术前一天由病房护士确认患者身份戴“腕带”,主管医生进行手术部位标记。手术患者核对:查对患者姓名、性别、年龄、病案号、诊断、手术名称、手术部位(左、右)等。
接接患者之前:导管室护士与病房护士查对,进行患者姓名、性别、年龄、手术名称、手术部位的确认。进入手术间后:手术医生与导管护士共同与清醒的患者交谈查对,确认患者身份。
(二)输血患者身份识别:
采用“腕带”、“患者家属及陪护亲友”、“患者姓名、性别、住院号”识别。根据医嘱、输血申请单,护士两人核对患者姓名、病案号并与患者核实后方可抽血配型。输血前需两人核对患者床号、姓名、住院号及血型(含Rh因子),检查采血日期、血液有无凝血块或溶血、血袋有无破裂、输血单与血袋标签是否一致,同时检查供血者的姓名、血型(含Rh因子)及血量是否相符,交叉配血报告有无凝集,无误后方可输入。
海阳市人民医院神经内科
标识识别 篇5
在计算机辅助测量中, 为了实现从不同空间坐标拍摄的场景图片来实现物体三维信息重构, 需要对场景中的标志点进行识别和定位, 解决摄像机初始定向问题的常用方法是在被测物体上粘贴编码标志点, 利用图像中的编码标志和结合对极几何约束解算出相邻图像间的基本矩阵。基本矩阵是摄像机内外参数的综合表象, 利用基本矩阵可得到相机的在世界坐标中初始位置姿态, 作为摄像机的初始定向。聚类分析是数理统计中的一种分析方法,它是用数学方法定量地确定样本的相似关系[1]。把不同的形状标志点作为聚类中不同的样本, 通过模糊划分矩阵把不同的样本区分开来, 达到同编码标志点的一样的区分功能[2]。本文提出一种可以应用于物体表面三维数据提取的标志点提取方法并叙述其原理。
2 识别原理
在三维测量中通常使用的标志点是数位环形编码标志, 编码标志中心的圆是定位圆, 用于提取编码标志的位置信息, 周围的环形为编码段, 用来提取编码标志的编码值信息。每个编码标志均对应唯一一个编码值, 在测量中可以通过编码值实现同值编码标志的匹配[3]。现在对环形编码标志点进行改动, 形状区域分别变成圆形、方形和十字形, 如图1 所示, 以圆形、方形和十字形代替编码值, 但这种以形状代替编码值方式缺点是可作为编码值的形状较少, 但对于编码标志点数量需求少的场合是可以满足要求。
在此对选用的圆形、方形或十字形三种标志点区域划分成7×7 等份, 每个小区域再划分为16×16 等分,每个标识点占据的像素区域为7×7×16×16 图像点,标志点图形分成49 个区域后, 每个区域中标识点图形占据的像素为n ≤ 16×16,n/7×7×16×16 作为区域的特征值xi, 计算7×7 等分中每一个等分黑像素所占比例作为为特征值, 可得到每个标志点有49 个特征值[4]。实际应用中图像内标志点的大小是受多种因素影响, 只要占据的区域不过于太小对识别结果影响不大。理想的标志点图形可以构成具有三个理想样本的一个聚类, 对应的模糊划分矩阵是3×3 的矩阵。对三种待识别标志点分类的标准是三个标志点图像与聚类中心的距离平方和最小或。因为一个样本是按不同的隶属度属于聚类中的标准样品的, 所以应同时考虑每个标志点与的聚类中心的距离。如果与聚类中心较远可以认为是伪特征点应以排除。将三种样本逐个输入去计算与聚类中心的距离,与聚类中心较近应属于同一类, 再加以判别。
对于应用于标识点识别的模糊聚类分析主要包括3个模块: 标识及特征提取模块, 模糊矩阵计算模块, 模糊聚类模块。标识及特征提取模块负责完成对图像的标识点特征的提取。通过相应的准则进行连通性的判断,并把标识出标志点添加标号。利用像素占据每块区域的比例的方法得到每个标识点的特征值, 以用来计算模糊距离[5]。模糊距离计算模块根据特征值计算三个样品间的初始模糊距离, 构建模糊矩阵。模糊聚类模块根据采集的图像质量输入聚类阈值对样本进行分类输出结果,总体系统结构流程图如图2 所示。
3 图像预处理
COMS图像传感器在时序控制下读取每个像素点的灰度值, 在图像采集过程中调整相机距离物体的距离使标志点所占据的像素区域尽可能占据7×7×16×16 个像素区域大小附近, 由于定向反光标志点可使传感器局部过饱和, 所以可以通过控制镜头的光阑大小和CMOS的增益来减小图像传感器对背景光的响应, 但在单色光照射下获得的背景光和定向标志点数据并不是理想的二值化数据, 从灰度直方图上可以知道数据分布趋向两个值, 背景光对应低灰度值, 定向标志点对应高的灰度值,对图像进行二值化时对于8bits灰度阈值可以取大于220, 这样很好的突出标志点的像, 把灰度大于220 的像素直接替换成255, 否则替换成0。对预处理后的图像中的对各个标志点进行标号, 首先检测缓冲区, 从左到右,从上到下, 依次检测每个像素, 如果某像素点像素灰度值为255, 则依次检测该点像素(x,y) 相连通的邻域点集合{(x±1,y±1)} 共8 个点的像素值[6], 根据连通性判断标志点区域, 一幅图像内可能存在多个连通成分, 每个连通成分都对应一个待识别的目标图像区, 给各目标图像区分配相应标号的工作做为标记, 图像标识及特征提取的算法流程图如图3 所示。
4 标志点的识别
经过上述图像预处理后, 可以认为得到N个标志点, 首先计算N个标志点之间的模糊距离, 然后构造等价类, 设其中两个标志点的特征值分别为Xi,Xj,Xi=(xi1,xi2,…,xi49)T,Xi=(xj1,xj2,…,xj49)T, 在此采用欧式距离算法,
得到模糊系数矩阵Dij, 记录下模糊系数矩阵中的不同系数并对其大小进行排序, 其中标志点图像必然存在质量差的, 通过设定阈值使得在分类中去除图像质量差的标志点作为模糊聚类的阈值, 去掉系数矩阵中较小系数的所对应的标志点。设 ω 为代表三种标准的标志点聚类, 设通过采集的标志点和类内标准标志点分别为,Xi=(xi1,xi2,…,xi49)T,,计算归为一类的标志点与类内标准标志点的距离, 与三个标准标志点距离最小的标志点可以认为是一种形状的标志点, 达到了判别标志点的形状和归类, 整个模糊聚类算法如图4 所示。
5 结束语
本文主要讨论了基于模糊聚类对标志点的识别方法, 在合理选择标志点形状和数量情况下, 通过计算标志点特征值及标志点之间相互距离, 通过设定阈值去除伪标志点, 通过模糊聚类识别方法分出标志点种类, 此方法可以满足三维测量中对标志点识别的需要。
摘要:提出模糊聚类应用于三维测量中标识点的识别方法 ,通过计算标志点间的欧式距离和模糊矩阵系数可以去除具有成像缺陷的标志点图形,根据标志点与标识样品间的欧式距离可以判断出标志点的形状,此方法应用于三维测量可以提高标志点识别能力和质量。
关键词:模糊聚类,标志点,识别方法
参考文献
[1]李士勇.工程模糊数学及应用[M].哈尔滨:哈尔滨工业大学出版社,2004.
[2]杨淑莹.图像模式识别[M].北京:清华大学出版社,2005.
[3]邾继贵,于之靖.视觉测量原理与方法[M].机械工业出版社,2012.
[4]邾继贵,叶声华.工业现场近景数字摄影视觉精密测量[J].地理空间信息,2004,(6):11-14.
[5]冯伟兴,梁洪,王臣业.Visual C++数字图像模式识别技术详解[M].北京:机械工业出版社,2012.
标识识别 篇6
随着人工智能算法和数字图像处理技术的发展,国内外对形状的智能识别做过大量研究。Du等[2,3]利用计算机视觉技术,提出了一种披萨饼形状提取和分类的方法,实现了对披萨饼形状的实时监测。Shi等[4]利用支持向量机智能算法,设计了一种交通标识牌形状识别方法。王津京等[5]通过识别苹果形状,设计了一种自动采摘苹果的装置。然而,将人工智能算法应用于轮胎标识点形状识别的研究较少。
本文提出的基于傅里叶描述子的轮胎标识点形状识方法,主要包括标识点图像获取、图像去噪、图像分割、轮廓提取等图像预处理。提取边缘轮廓的傅里叶描述子系数,计算待识别标识点与模板库标识点的傅里叶描述子的欧氏距离,实现轮胎标识点形状识别。
1 轮胎标识点图像获取
在轮胎标识点图像的获取过程中,轮胎生产车间内存在着诸多干扰因素:外界光照、电压波动等。这些干扰因素将会导致获取的标识点图像质量不高,然而标识点图像的质量将会直接影响到后续图像处理的结果。为了能够获取较高质量的标识点图像,设计了一种轮胎标识点图像采集装置。图1为轮胎标识点图像采集装置的结构示意图。
分析图1,不难发现在标识点图像采集装置中,存在两套照明装置和两台工业相机。这是由于本文研究的轮胎标识点图像分布于轮胎的两侧面。由于传输结构的限制,图像采集装置中的下相机,不能够通过一次拍照而获取完整的轮胎标识点图像。为此,通过设置下相机拍照的感兴趣区域宽度,对同一轮胎进行多次拍照(一般拍摄6次),然后对获取的条状轮胎图像,进行拼接形成一张完整的轮胎标识点图像(图2)。
2 轮胎标识点图像预处理
2.1 图像降噪
轮胎标识点图像是通过CCD摄像机获取的,而图像在电子线路的传输过程中会在图像中引入噪声。噪声会降低图像的质量,同时对于接下来的图像分割和边缘检测产生不利影响[6]。中值滤波是一种非线性滤波技术,该种滤波方法能够在去除噪声的同时保护图像边缘信息不受破坏。中值滤波的基本原理是把图像像素点划分为多个P×P的小方格(P为奇数),方格中心像素是降噪的对象,利用公式1计算出方格的像素中值并替换掉中心像素。
2.2 图像分割
识别轮胎标识点的形状,需要把标识点从轮胎背景图像中分割出来。基于灰度直方图的阈值分割方法,不仅操作简单而且图像分割效果较好。该图像分割方法,是通过分析图像的灰度直方图来选取最佳分割阈值,从而将目标区域从背景中分割出来[7]。如果图像的灰度直方图只有两个峰值,那么最佳分割阈值为两个峰值之间的最小灰度值。如果图像的灰度直方图中含有多个峰值,那么分割阈值设置在两个最为凸出的峰值之间。
图3为轮胎圆形标识点图像分割结果,利用灰度直方图的阈值分割方法能够将标识点较为完整地从背景图像中分割出来。
2.3 轮廓提取
要识别轮胎标识点的形状,需要对标识点进行边缘轮廓坐标提取。八邻域搜索算法是常用的轮廓坐标提取方法,若某一点A为轮廓边界上一点,那么轮廓的下一点必定在其八个邻域中。图4为八邻域搜索算法的工作原理图,从A点开始依次按A0,A1,…,A7逆时针顺序不断搜索边缘轮廓的下一点坐标。由于轮胎标识点轮廓边界点数往往较多,而标识点的形状只需要一些有代表性的的点就可以很好地描述。为此,在编制轮胎标识点轮廓坐标提取程序时,设置了输出坐标点的间距,并将需要输出的坐标点在标识点图像中按顺序编号标出。输出坐标点的数量满足2n。采用128个轮廓点坐标来描述秒时点形状特征。图5和图6分别为圆形标识点轮廓坐标提取效果和轮廓坐标点输出结果。
3 轮胎标识点形状识别
3.1 傅里叶描述子
经过对轮胎标识点图像的预处理,获得了待识别标识点的轮廓坐标信息。为了描述轮胎标识点的形状,本文采用傅里叶描述子对标识点形状进行定量表示[8—10]。傅里叶描述子的基本思想是:设物体的形状是一条封闭曲线,任取2.3中N个坐标点中的一个作为起始点,然后沿着顺时针方向环绕一周,便可以得到如式2所示的复数序列。
s(k)的离散傅里叶变换为
式(3)中,傅里叶系数S(u)可称为描述形状的傅里叶描述子。
为了能够识别具有旋转、平移等变化的标识点形状,需要对傅里叶描述子进行归一化。假设标识点图像坐标平移(Δx+jΔy),尺度放大M倍,旋转θ角度后,得到的傅里叶变换系数为:
由此可得:
分析式(5)可知,标识点图像坐标旋转θ角度,平移(Δx+jΔy)后,傅里叶变换仅改变相位,标识点图像放大M倍后傅里叶变换也相应放大M倍。除去平移变化对标识点形状描述子的影响S(0),可得到归一化的傅里叶描述子d(u)。
3.2 标识点形状识别
归一化的傅里叶描述子d(u)具有尺度、旋转和平移不变性,可以用来计算任意两个形状的相似程度。本文采用欧氏距离计算标识点的归一化描述子和模板库标识点的形状差异,实现标识点形状的识别。由于形状的能量多集中在低频部分,傅里叶变换的高频分量一般很小且易受噪声干扰。因而,只取归一化傅里叶描述子的低频分量描述形状差异(一般取描述子维数M=12)。欧氏距离的计算公式如式(7)所示。
dE越大,表示两个形状的相似程度越小,反之,则表示两个形状越相似。
4 应用实例
4.1 实验装置
实验采用如图7所示的实验装置。该实验装置主要包括轮胎标识点图像采集部分:CCD摄像机、LED照明光源等,以及传送装置等。轮胎标识点形状识别算法流程图如图8所示。
4.2 实验
首先对获取的轮胎标识点图像进行中值滤波降噪处理,然后对去噪后的图像进行分割,再利用八邻域搜索算法提取分割后图像的边缘轮廓坐标。表1为四种标识点图像经过图像预处理后的典型实例。
通过对获取的标识点图像的边界坐标进行傅里叶变换,提取标识点轮廓形状的傅里叶描述子系数。通过欧氏距离计算待识别形状的傅里叶描述子系数与模板库形状的差值,实现标识点形状的识别。表2为表1中待识别形状,与模板库形状进行欧氏距离计算后形状识别的结果。
分析表中的数据可知,与最小欧氏距离相对应的标准形状即为待识别轮廓的近似形状。通过对比表1和表2不难发现,利用傅里叶描述子对标识点形状进行定量描述,并利用欧氏距离进行标识点的形状识别能够得到较为理想的识别效果。
注:轮廓1~4分别表示待识别的圆形、正方形、菱形和十字形。
实验还对四种标识点形状识别的准确率分别进行检测,每种形状50幅照片共计200幅轮胎标识点图像。实验结果表明,四种标识点形状的平均识别准确率为97.25%,满足工业要求。具体实验数据如图9所示。
5 结语
本文利用归一化傅里叶描述子,对轮胎标识点图像的的形状进行定量描述;并把傅里叶描述子和欧氏距离应用于轮胎标识点形状识别。通过计算待识别标识点形状的傅里叶描述子,与模板库中标识点形状的傅里叶描述子的欧氏距离,分析发现与最小欧氏距离相对应的标准形状,即为待识别轮廓的近似形状,从而实现轮胎标识点的形状识别。实验通过对200幅轮胎标识点图像进行形状识别,获得了97.25%的平均正确识别率,满足工业要求。
参考文献
[1] Wu Z.The application automatic recognition technology into tire industry.Tire Industry,2002;22:760—763
[2] Du C J,SUN D W.Shape extraction and classification of pizza base using computer vision.Journal of Food Engineering,2004;64(4):489 —496
[3] Du C J,Sun D W.Multi-classification of pizza using computer vision and support vector machine.Journal of Food Engineering,2008;86(2):234—242
[4] Shi M,Wu H F,Fleyeh H.Support vector machines for traffic signs recognition.IEEE World Congress on Computational Intelligence,2008;3820—3827
[5] 王津京,赵德安,姬伟,等.采摘机器人基于支持向量机苹果识别方法.农业机械学报,2009;40(1):148—151Wang Jinjing,Zhao Dean,Ji Wei,et al.Apple fruit recognition based on support vector machine using in harvesting robot.Transaction of the Chinese Society for Agriculture Machinery,2009;40(1):148 —151
[6] 王勇,郭慧.基于形态学的焊缝X射线图像缺陷检测.东华大学学报,2013;39(4):360—363Wang Yong,Guo Hui.Defect recognition of weld X-ray image based on morphology.Journal of Donghua University,2013;39(4):360 —363
[7] Otsu N.A threshold selection method from gray-level histograms.IEEE Transactions on Systems Man and Cybernetics,1979;9(1):62—66
[8] Persoon Z,Fu K S.Shape discriminating using Fourier descriptors.IEEE Trans on PAMI,1986;8(3):388—397
[9] Zahn C T,Roskies R Z.Fourier descriptors for shape closed curve.IEEE Trans on Computer,1972;21(3):269—278