QR二维码(共4篇)
QR二维码 篇1
引言
条码技术至今虽有60多年的历史了, 但一维条码仍存在很多不足: (1) 一维条码只能在水平方向表示信息, 信息密度较低, 容纳的信息量较小; (2) 一维条码没有纠错能力, 条码一旦受外界破坏后, 无法识别, 抗干扰能力较弱; (3) 一维条码不能进行有效的加密处理, 保密防伪性较差; (4) 一维条码只能对一些物品进行标识, 而不能对这些物品进行详细的描述, 对数据库的依赖性较强。为了解决上述一系列问题, 一种信息容量相对较大、抗干扰能力强、保密防伪性强的二维条码便应运而生[1]。
常见的二维码有PDF417、Code49等20余种[2]。其中QR码是1994年日本Denso Corporation公司设计出的一种矩阵式二维码[3], QR码具有超高速识读、纠错能力强和可以有效表示中国汉字等优点, 是目前最为常用的二维条码之一, 在我国也得到了广泛应用, 因此本文选取QR码作为研究对象[4,5]。
本文就是为解决二维码在解码识别过程中会受到各种外界因素干扰的问题, 利用图像处理技提高二维码的解码效率。
一、QR码图形结构
QR码符号就是由多个黑色和白色小正方形模块组成的一个大的方形阵列, QR码符号结构由功能图形、编码区域和四周空白区域组成, 其中功能图形由位置探测图形、位置探测图形分隔符、校正图形和定位图形组成;编码区域由格式信息、版本信息和除了功能图形外的一些闲置区域组成。图1为QR码版本7符号的结构图[6,7]。
二、QR码图像处理过程
2.2图像中值滤波。二维码在采集过程中往往受到各种噪声的干扰, 其图像往往存在着边沿毛刺、孤立点噪音等变形。为提高二维码的解码效率, 应进行滤波去噪处理。通过验证, 中值滤波中的正方形窗口可以较好地去除QR码图像中的噪声, 同时还可以确保QR码图像边缘不受影响[9]。通过实验, 确定采用中值滤波模板为3x3的方形窗口效果最好。图3为采用3x3窗口滤波后的效果:
一般情况下, 如果µ1=µ2, 只能求出一个最优阈值
当时S1=S2, 可以求出最优阈值:
公式9则可得出s (z) 中的5个未知参数:
2.5图像旋转。QR码具有360度识别的特征, 所以在理论上, 不需要对倾斜的图像进行纠正。但如果不对QR码图像进行旋转操作, 就必须利用QR码符号的位置探测图形特征数组进行模板匹配计算条码图像的倾斜角度, 运算量较大[11]。因此, 本文采取先旋转图像再进行图像识别的办法, 从而可以针对未倾斜的图像进行快速识别, 节省了模板匹配、求倾斜角度的时间, 以及倾斜图像识别的额外开销, 减小了后续解码的难度。
三、QR码解码
(1) 扫描QR码图像读取条码的格式信息、版本信息、纠错等级以及条码的掩模图形信息, 从而确定QR码的版本号;
(2) 根据步骤 (1) 中读取的掩模图形, 对二维矩阵中的编码区域数据进行异或操作, 从而消除掩模;
(3) 根据QR码符号的模块布置规则从数据矩阵中提取数据, 从而得到数据码字流和纠错码字流;
(4) 使用与纠错等级信息相对应的纠错码字通过RS纠错算法检测错误, 若在检测过程中发现错误, 则进行纠错;
(5) 根据QR码相应版本符号的模式指示符和字符计数指示符, 对纠错后的数据信息进行解码。
四、结语
本文研究了QR码图像预处理技术以及QR码解码方法, 其中图像预处理包括图像灰度化、二值化、滤波去噪、边缘检测和图像的旋转, 实现了实际应用中QR码的识别。实验表明, 采用图像处理技术进行QR码解码的方法, 能够高效地识别受到外界因素干扰的条码, 增强了QR码的适应能力。
参考文献
[1]PAVLIDIS T, SWARTZ J.Fundamentals of barcode information theory[J].IEEE Transactions on Computers, 1990, 23 (4) :74-86.
[2]李军.QR码的图像恢复和识别技术研究与实现[D].苏州:苏州大学, 2010.
[3]中华人民共和国国家标准GB/T18284--2000.快速响应矩阵码[s].
[4]OTTAVIANI E, PAVAN A, et al.A common image processing framework for 2D barcode reading.Image Processing and its Applications, Conference Publication, IEEE, 1999 (465) :652-655.
QR二维码 篇2
根据《质检总局关于进一步加强电梯安全工作的意见》 (国质检特[2013]14号) 和《转发国家质检总局《关于进一步加强电梯安全监察工作的意见》的通知》 (鄂质监办特[2013]5号) 等有关文件要求, 为共同做好电梯安全工作, 应用新的电梯使用标志替代原《安全检验合格标志》。新的电梯使用标志增加了登记机关、应急救援电话等内容, 还增加了二维码防伪标志。
新电梯使用登记标志样式如下:
二维码可以使电梯使用标志具有防伪功能, 便于读出该电梯相关信息, 实现信息化管理。电梯检验员现场检验时, 可通过手持终端, 扫描二维码读取设备信息, 与特种设备监察检验系统数据库信息、特种设备实际使用情况进行比对, 确认设备信息并进行检验。二维码信息还可对公众开放, 使特种设备使用人员特别是电梯乘客了解设备检验情况, 监督电梯使用管理责任单位对电梯履行职责, 确保电梯安全使用。
总局规定的电梯使用标志中, 二维码为固定印刷的, 或需使用专用软件进行二次打印, 很不方便, 也没有完全体现二维码的功能。武汉市特种设备监督检验所根据实际需要率先开发了基于QR二维码的电梯使用标志生成、打印、读取识别系统。
1二维码选型
二维码是用某种特定的几何图形按一定规律在二维方向上分布的黑白相间的矩形方阵记录数据符号信息的条码技术, 已经在日常生产生活中得到大量应用, 如网址、表单、产品溯源追踪等方面。根据排列方式, 可分为矩阵式二维码如Code One、QR Code和行排式二维码如CODE49、CODE 16K、PDF417等。除了这些常见的二维条码之外, 还有国产的GM码、田字码等。目前最常用的码制是QR二维码, 最常见的应用是手机二维码。
手机二维码就是二维码技术在手机上的应用。将手机需要访问的信息编码到二维码中, 利用手机的摄像头识读。手机二维码可以印刷在报纸、杂志、广告、图书、包装等多种载体上, 用户通过手机摄像头扫描二维码即可实现快速手机上网, 快速便捷地浏览网页、了解企业产品信息, 省去了在手机上输入URL的繁琐过程, 实现一键上网。同时, 还可以方便地用手机识别和存储, 获取公共服务, 实现电子地图查询定位等多种功能。随着3G时代的到来, 手机二维码为网络浏览、下载、网上支付等提供方便的入口。
通过对比各种二维码的优缺点, 考虑电梯使用标志中的二维码主要面向广大乘客, 让社会大众通过二维码对电梯质量进行监督。所以使用的二维码必须方便扫描识别, 识别速度必须要快。综合考虑, 我们选择了QR码来开发电梯使用标志中的二维码。
QR码主要具有以下优点:
1) QR码存储的数据量更大, 可以包含数字、字符, 及中文文本等混合内容。理论上内容经过压缩处理后可以包含7089个数字, 4296个字符, 984个中文字符 (UTF-8格式) 。
2) 有一定的容错性 (在部分损坏以后可以正常读取) , 空间利用率高。按照QR码的标准文档说明, QR码的纠错分为4个级别, 分别是:levelL、levelM、level Q、level H, 最大能够纠正7%、15%、25%、30%的错误。
3) 更主要的是读码解码速度快。QR就是取自“Quick Response”的首字母, 一般的QR码图, 通过手机摄像头从拍摄到解码到显示内容也就三秒左右, 对摄像的角度也没有什么要求。
4) 应用范围广。支持常用手机扫描软件支持格式, 如我查查、快拍二维码、微信等。
目前对QR二维码最主要的担心就是其安全性。目前QR码的安全问题被炒作放大, 主要的原因是QR二维码生成及扫描工具是病毒或扫描的链接是恶意的。QR二维码本身不会含有病毒、木马或扣费软件。如果QR二维码不被二次包装, 就不会含有这些不安全的因素。另外每台电梯使用标志的二维码都不一样, 特别是将注册代码 (类似人的身份证号) 采用SHA1散列摘要算法加密, 篡改二维码的内容也不容易, QR二维码的安全性还是有较高的保证的。
2QR二维码的原理
QR码是属于开放式的标准, 呈正方形, 只有黑白两色。在3个角落, 印有较小, 像回字的的正方图案, 用于位置探测。除数据区域外, 还有校正图形、定位图形、纠错信息、版本信息、纠错码字等。
在上图21*21的矩阵中, 黑白的区域即校正图形和定位图形。黄色的区域用来保存被编码的数据内容以及纠错信息码。蓝色的区域, 用来标识纠错的级别。
3QR二维码开发应用
3.1 开发方案
电梯使用标志长140mm、高90mm, 厚度约0.2mm, 留给二维码的区域约20*20mm。为了提高效率和效果, 方便套打及在线识别, 经选用市面上常见不同打印机及手机、平板电脑测试, 二维码包含信息在100字符以内较好, 识别终端像素在500万以上、打印终端为平推打印机, 分辨率在360*180dpi以上。我单位开发的二维码只包含网址, 二维码识别后联网接入电梯使用登记信息查询专网, 再连入特种设备监察检验数据库实时查询并显示信息。
我们选择的识别终端为1.2MHz四核CPU、1G内存、800万像素摄像头的普通智能手机或平板电脑。识别软件采用最常用的带二维码扫描功能软件“我查查”或“微信”, 网络采用3G移动网络或WIFI网络。服务器操作系统为Windwos2003服务器版, 数据库系统为SQLServer 2005, 使用某公司QR二维码组件包、用友华表公司CELL组件包等第三方控件。
系统实现的主要功能, 包括QR二维码的生成打印和QR二维码的读取识别。
3.2 QR二维码生成打印
利用已有的电梯合格证打印功能, 附加二维码生成打印功能即可实现。具体流程及主要代码如下:
下面是电梯使用标志打印、预览界面及实际效果图。
3.3 QR二维码的后台访问查询
用手机终端扫描二维码, 进入电梯使用登记信息查询专网, 进行设备信息和设备检验信息的查询及仿伪查询。
后台Web页主要功能实施流程如下。
3.4二维码信息的读取
用手机软件我查查扫描上述二维码, 手机识别二维码为一个网址:
http://219.139.240.44/web/SynthesisQuery/DTZCDJB.aspx?U0JaQ0RNPTMwMTA0MjAxMDQyMDA5MDcwMDly, 通过手机浏览器访问该网址, 出现图7显示的表格。用微信扫一扫也可直接得到图7显示的表格, 如果用专用软件特种设备手持系统则可直接得到图8显示的表格。
表格中显示了查询得到电梯的公共信息, 如设备注册代码, 维保单位, 检验单位, 应急救援电话, 下次检验日期等, 这些信息为特种设备监察检验数据库中实时查询得到的信息, 检验员和广大乘客可与打印粘帖在电梯显著部位的电梯使用标志进行比对, 如发现不一致, 即可判定该使用标志为假冒或使用标志未更新。
若要进一步获取设备信息, 如设备参数、检验信息等, 可以登录, 得到图9显示的表格。该用户名和密码与特种设备监察检验系统中用户名和密码一致, 为检验员专用。
4 结论
基于QR二维码的电梯使用标志系统于2013年5月初投入正式运行, 截至目前, 全市近5万台电梯已全部更换含二维码的电梯使用标志。经过实际应用, QR二维码基本可以精确的打印在电梯使用标志相应的位置。打印的清晰度可以满足要求, 一般的手机可以很快的扫描出二维码, 在有移动网络的情况下, 可以顺利的访问出相关的信息, 完全实现了总局规定的功能。
参考文献
[1]质检总局关于进一步加强电梯安全工作的意见 (国质检特[2013]14号) .
[2]田杰.浅谈二维码在企业信息化中的应用[J].企业导报, 2012 (2) 288.
[3]沈峥.基于创达版特种设备检验系统的条形码开发及应用[J].电脑编程技巧与维护, 2010 (22) :58-59.
[4]曾子建.基于QR二维码编解码技术的研究与实现[D].电子科技大学, 2010.
QR二维条码纠错算法改进 篇3
标准建议QR二维条码的纠错编码采用RS编码。RS码具有同时纠正突发错和随机错的能力,更利于纠正突发错。但是RS纠错编码最高只能纠正30%的错误。由于二维条码标签在使用过程中会受到污损。当纸质的二维条码标签就容易受到污染和破损后。这就要求本系统使用的二维条码的达到50%纠错能力。本文研究了采用LDPC编码替换RS编码以提高QR二维条码的纠错能力。
LDPC纠错码的编解码原理
1 LDPC的编码实现
LDPC码是一种(n,k)线性分组码,LDPC码主要通过校检矩阵H参与运算得到,H要求是m(m=n-k)行n列的矩阵,每列表示码字的一数位,每行表示一个校检方程,矩阵每行中“1”的数量称为行重(1),每列中“1”的数量称为列重。公式(1-1)是一个5行10列的校检矩阵及其相应的校检方程,设有生成的码字c=(c1,c2,c3,c4,c5,c6,c7,c8,c9,c10)∈C,满足条件H×CT=0。
可以看出H矩阵为稀疏矩阵,1的个数在行列方上数都为相同。这样性能好,复杂性低。采用高斯消元法构造维数为m*n的校检矩阵H。
找出H矩阵的难度较大,需要H矩阵秩r=n,需要H矩阵各行不会全为0,变换出生成矩阵G=[Pk×(n-k)Ik×k],待校检的信息序列m=[m1,m2,…,mk]通过C=m G生成矩阵运算后可得到码字C。LDPC码有规则和不规则的两种,规则的LDPC码指的是校检矩阵中每行和每列的不为零元素的个数要相等。
通过分析LDPC编码过程可知,构造出校检矩阵是最关键的。生成矩可以通过变换构造矩阵得到,将生成矩阵乘以信息向量序列可获得符合LDPC编码规则的码字。生成过程按以下方法操作:
第一步:给低密度校检矩阵赋初值。
创建一个可生成LDPC编码的校检矩阵。要求该校检矩阵满足关系式H×CT=0。
第二步:当对LDPC码进行译码时需要区分信息位和校验位,寻找信息比特的位置是必须的操作,采用高斯消去法将校检矩阵H转变成H=[I,PT],注意I为单位阵。
第三步:变换上一步得到的校检矩阵获得生成矩阵G=[P,I]。
第四步:将生成矩阵G乘以信息向量序列M,得到所需要的编码,C=m×G=[m×P,m]。
LDPC编码编码方法特点是利用校检矩阵的稀疏性来有效地进行编码,但是LDPC编码的复杂度和码长呈线性增长关系(2)。检验矩阵的原来结构影响着该编码算法,一种办法是对矩阵作行列变换,虽然能够实现近似线性的复杂度但不能完全满足实际需求。还有一种办法是选取特别的校检矩阵降低编码复杂性。例如任何两位相邻的码组中只有一位不同的循环码,容易硬件实现,采用一位寄存器实现校检位或者信息位编码,可降低运算复杂度,提高编码效率,使码长增长与运算复杂度呈线性关系(3)
2 LDPC的译码实现
LDPC编码的译码算法可以通过硬判决法、软判决法实现译码(4)。这些算法的纠错能力和计算复杂度是有差异的,在算法效率上,硬判决比软判决更低;在算法难度上,硬判决比软判决更低;在算法纠错能力上,软判决比硬判决更好。例如Gallager提出的比特反转译码算法就属于硬判决解码算法。该算法虽然运算量较小但是对软判决信息没有充分应用,由于没有充分利用软判决信息所以纠错能力较差。软判决译码算法是—种通过信息传递译码算法,也可以称作置信传递译码算法、最小和积译码算法,该算法运算性能最好,有很好的应用领域。软判决译码算法的译码过程是:预处理接收到的码字,统计比特节点的概率数据,再经过迭代处理,然后将统计的概率信息传到校检节点,接下来统计校检节点的概率数据再传到比特节点上,如此反复,每次都要进行译码判断(5),这样就完成了一个译码数据的传递和迭代,当成功译码则结束传递和迭代。如果迭代的次数达最大数还没成功译码则提前结束。
LDPC编码与RS编码的仿真比较
1选择信噪比和比特误码率
仿真工具选择MATLAB,分析参数选信噪比和比特误码率,作图分析不同迭代次数下的信噪比和比特误码率变化情况。理论证明LDPC编码在编码数据较多时有更好的情能,故只须验证较少的编码数据来编码实验。一般的比特误码率越低说明纠错性能越好,信噪比越大说明信号受干扰的越多,反之信噪比越小说明信号被干扰的较多。实验采用的信道为AWGN信道。实验前题是码长和码率不变,仅改变迭代次数模拟LDPC和RS的译码算法。LDPC编码的迭代次数分别取l、10、50;仿真结果如下图1所示,其中Eb/No表示信噪比,BER表示比特误码率。
通过分析仿真结果可知,当迭代次数增大时候,比特误码率变低即提高了LDPC编码的译码性能,当然随着迭代次数增大会增加LDPC编码的译码复杂度(6)。同时注意到当传输过程中当信噪比增大时LDPC译码曲线比RS译码下降的更快,当信噪比达到2d B时,LDPC编码的译码曲线下降快速而RS码的曲线下降缓慢,说明LDPC码有更低的比特误码率。因此,LDPC译码的比特误码率低于RS译码,换句说LDPC编码比RS编码有更高的译码性能。RS编码在信道环境较差时比特误码率基本不变,而LDPC编码在信道环境较差时比特误码率快速的降低,说明LDPC编码可以纠正较多的传输错位,提高传输效率。
下面再在保证不改变码率的情况下继续做仿真实验,变化校检位和信息位长度,得到结果如图2所示。由图2中可知,LDPC编码的译码性能优于RS编码的译码性能,当比特误码率等于10-5时,LDPC编码的信噪比为4.3d B而RS编码信噪比为6.5d B,也就是说相同误码率情况下,RS编码对信噪比要求较高,LDPC编码对信噪比要求更低。也可以说相同信噪比的条件下,LDPC编码有更低的误码率,纠错能力更强。
下面再在保证不改变码率的情况下继续做仿真实验,选择较大的码长情况下检测LDPC编码纠错情况与RS编码的纠错情况,如图3所示。
由图3所示,当码长增加时,RS编码对信噪比要求远高于LDPC编码。也就是说当编码信息量增大时RS编码对信道环境要求越大即抗干扰能力变弱,而随着编码信息码增加时,LDPC编码对信道环境的要求却降低,即抗干扰能力变强,纠错能力变好。如图所示当错误率为10-8时,LDPC编码对应的信噪比为4.8~5.8db,而RS编码在信噪比为10.5~lldb才能到达10-8。也就是说相同的误码率条件下,LDPC编码对信道要求更低,也就是LDPC码的抗干扰能力更强。
通过仿真实验比较LDPC编码与RS编码的纠错能力,可以得出LDPC编码的抗干扰性比RS编码更强,在QR二维条码的编码纠错中,采用LDPC编码替换RS编码。如果QR二维条码使用LDPC码作为纠错编码,将提高了QR二维条码的纠错能力,就可以扩大QR码的使用环境范围。原先的QR码是采用RS码作为纠错编码,该RS的纠错编码主要针对数据信息位进行编码的。因此在本系统采取不改变它的主要数据的纠错编码,原先QR二维条码的RS算法仅对数据信息编码。在编码的过程中不同的版本QR二维条码中信息位与纠错位数量是有差别的,版本越高则存储能力越强。QR二维条码原先的RS纠错编码有四个纠错等级,随着纠错等级的提高,需要更多的纠错位,纠错码占用的空间数位就越多,将减少对应的实际信息空间数位。而LDPC纠错编码不存在纠错等级划分,比起RS码要占用更多的空间数位用于纠错位,即降低的信息密度。但是LDPC编码的译码复杂程度明显的比RS编码好,LDPC编码的复杂程度与码长成正比,而RS编码的复杂度是随着码长成平方增长。在二维条码的使用过程中,二维条码会受到外界的环境影响,而出现出不同程度的污损,读取受到污损的二维条码图像后,有的影响可以在图像预处理过程中消除,大部分位于信息错误要靠纠错码来完成信息校正。QR二维条码是利用纠错编码来提高信息传递的可靠性,由前面分析可知,对于相同长度的信息进行纠错编码,虽然LDPC码比RS码需要更多的纠错位,即降低了信息的密度。但是LDPC码的纠错能力及抗干扰能力比RS码更强。所以在对QR二维条码进行编码是当数据容量相同的情况下采用LDPC码替代RS码可以增强QR二维条码的纠错性能。
注释
1张丽丽.LDPC码构造及其应用研究:[D].杭州:杭州电子科技大学,2011.
2张小花,李艳萍.改进的LDPC码Normalized BP-Based译码算法.计算机应用.2012.
3杨雪飞,李瑞.低复杂度多进制LDPC码译码算法研究阴.舰船电子工程,2011.
4刘原华.LDPC码的代数构造及译码算法研究[D].西安:西安电子科技大学,2009.
5陈旭灿.改进的LDPC译码算法研究.电子科技大学学报,2010.
6吴湛击.LDPC码的高效译码算法研究.系统工程与电子技术,2010.
QR二维码 篇4
QR二维码因其信息存储能力强、识读方便、保密性好等优点被广泛应用于制作业、物流等行业中。而在实际应用过程中,QR二维码经常被放置于各式商品之上,导致其所处的环境条件较为复杂,同时对其快速有效地识别产生了很大的影响。在条码识别的特定应用环境和要求下,消除复杂背景对二维码区域影响进行准确分割是保证二维码有效识别的基础。
在QR二维码识别过程中,对采集的图像进行分割是稳定、快速地识读二维码内信息的关键。图像分割方法主要以阈值分割为主,该方法具有计算简单、运算效率高、速度快等特点,但对于所处背景信息复杂的QR二维码图像,人们很难确定一个统一的阈值将QR二维码与复杂背景完全分离。为了实现复杂背景下目标区域的有效分割,研究者提出了多种能够实现不同目标的图像分割算法。宿丁[1]等针对复杂背景下多源多目标图像的分割问题,提出了综合利用红外图像灰度特征与可见光图像灰度以及分维数方差特征的分割算法。李敏花[2]等针对复杂背景图像中的文本抽取问题,提出了基于条件随机场的图像文本抽取方法,通过条件随机场的两个势函数分别描述图像的特征和上下文信息。王萍[3]等针对复杂背景下非规则带状区域提取问题,提出了“探测窗”协同加深“印象”算法。李丹[4]等针对复杂背景下激光图像三维表面重建中光条中心坐标提取问题,提出了两帧平均再相减的改进差影法,实现了复杂背景下激光条图像的分割。杨娜[5]等人针对多个车辆车牌的分割问题,引入视觉注意机制,利用不变性特征实现多目标的定位及最优分割尺度的选取。
面对一个复杂场景,人类视觉注意系统能够迅速将注意力集中在少数几个显著的视觉对象上,对其进行优先处理,该过程被称为视觉注意,并且该显著的视觉对象被称为感兴趣区域[6]。该区域的准确提取可以大大提高图像处理和分析的效率和准确度。如今,感兴趣区域(Region of Interest,ROI)提取技术已经应用于诸多领域,如视频图像质量的评估[7],彩色自然场景中视觉显著对象的检测[8],图像显著区域的提取[9],视觉假体的视觉显著图提取[10],人脸区域预检测[11]和复杂背景下红外小目标检测[12]等。
为了解决复杂背景下QR二维码图像的准确分割问题,本文研究了复杂背景下QR二维码图像的有效分割算法。首先,研究常见图像分割算法对复杂背景下QR二维码的分割效果,如基于灰度特征的Otsu算法、基于颜色信息的色差算法以及K-means聚类算法;其次,研究基于视觉注意机制的感兴趣区域提取算法对复杂背景下QR二维码的分割效果,如Itti模型和GBVS模型,以期消除复杂背景对QR二维码有效识别的影响,提高复杂背景下QR二维码的有效识别率和识别效率,实现复杂背景下QR二维码的有效识别。
1 基于常见图像分割算法的复杂背景下QR二维码分割处理
常见的图像分割算法有基于灰度特征的Otsu算法、基于颜色信息的色差算法和K-means聚类算法等。采用此3种方法分别对复杂背景下的QR二维码图像进行分割处理,获得的分割结果如图1所示。图1中(a)和(e)为复杂背景下的QR二维码图像;(b)和(f)分别是利用Otsu算法分割的结果;(c)和(g)分别是利用色差法分割的结果;(d)和(h)分别是利用K-means算法的分割结果。实验表明Otsu算法不能消除复杂背景,而色差算法在消除复杂背景的同时也消除了目标区域,K-means聚类算法也不能消除复杂背景或直接消除了目标。总之,常见图像分割算法都不能从复杂背景中分割出QR二维码图像,所以仍需要考虑性能更加优良的分割方法。
2 基于视觉注意机制的复杂背景下QR二维码图像分割处理
基于ROI的图像提取算法不仅能够提高图像的清晰度,还可以保留图像中的重要信息,本节旨在实现复杂背景图像中的QR二维码区域的准确分割,以减少复杂背景对QR二维码识别的快速性和准确性的影响。
2.1 Itti视觉注意模型
Itti模型[12]是最经典的视觉注意力模型之一。该模型首先从输入图像中提取多种特征,如亮度、颜色和方向;其次,通过高斯金字塔和中央周边差对图像进行处理形成各特征的关注图;再次,把得到的各个关注图归一化、融合得到总的显著图;然后,在此基础上,通过赢者为王神经网络相互竞争吸引注意焦点,使得最显著区域胜出,即得到感兴趣区或注意区;最后,通过返回抑制机制抑制当前显著区域,使注意力转向下一个最突出的区域。Itti模型的实现步骤如下:
1)视觉预处理。从输入的彩色图像中获得红、绿、蓝分量,并计算图像的强度I=(r+g+b)/3。金字塔中的每个像素构成颜色通道,红色通道表示为R=r-(g+b)/2,绿色通道表示为G=g-(r+b)/2,蓝色通道表示为B=b-(r+g)/2。通过过完备可控制的滤波器检测图像中每一点的方向。
2)中央周边差算子。计算某一特征的中央周边差来确定对比,执行这个操作在空间尺度上通过插值到小尺度,然后逐点相减。
3)归一化。把图像中的值归一化到一个固定的区间[0…M],消除振幅差异。计算图像某区域的最大值M,并计算图像其他区域的平均值m,然后用图像乘以(M-m)2。
4)关注图。以4为尺度将特征图像组成三个显著图像。
5)显著图。分别归一化三个关注图并相加得到最后输入的显著图。
2.2 GBVS视觉注意模型
Harel[13]最早提出了GBVS(Graph-Based Visual Saliency)模型,该模型是在Itti模型的基础上运用马尔可夫随机场的特点构建二维图像的马尔可夫链,通过求其平衡分布而得到相应的显著图[14]。GBVS模型的实现步骤如下:
1)获取多尺度亮度信息。利用式(1)所示的高斯金字塔低通滤波器对输入的灰度图像进行滤波操作:
其中,(x,y)代表像素的位置,σ表示比例因数。
2)获得多尺度的方向信息。利用一组Gabor金字塔滤波器对原始灰度图像进行滤波,如式(2)所示:
上式中σ是比例因子,f是正弦波形频率,θ是方向角度,θ=[0,π/4,π/2,3π/4]。因此,四组不同尺度的滤波结果构成了方向通道。
3)计算图像不同尺度和不同特征的马尔可夫平均分布。
4)获得显著图。通过对不同通道的马尔可夫平均分布的求和与归一化得到其大小与原始图像相等。
3 试验结果与分析
3.1 试验结果
1)试验样品
为了验证文中算法对消除复杂背景影响的QR二维码分割的有效性,选取10幅不同背景下拍摄的QR二维码图像进行了试验,试验图像均于2016年3月20日在西北农林科技大学机械与电子工程学院采集,采集时光照为日光灯照射。采集距离目标约15厘米,所有采集图像为JPEG格式。
2)试验软件及硬件
试验均在2.6GHz处理器、4G内存的联想笔记本上完成,试验程序均在MATLAB 2013a环境下编写、运行。
3)试验方法
试验过程的步骤如下:
Step1)输入复杂背景下的QR二维码图像,依次获取GBVS和Itti的显著图。
Step2)利用提取出的显著图中二维码区域与背景的灰度差异,分割出QR二维码图像。
利用Itti模型和GBVS模型分别对复杂背景下的QR二维码图像的感兴趣区域进行提取,获得的结果示例如图2所示。其中,复杂背景下的QR二维码原始图像如图2(a)、(f)、(k)、(p)、(u)所示,图2(b)、(g)、(l)、(q)、(v)以及图2(c)、(h)、(m)、(r)、(w)分别是GBVS模型和Itti模型对应提取的显著图,图2(d)、(i)、(n)、(s)、(x)以及图2(e)、(j)、(o)、(t)、(y)分别是从对应的图2(a)、(f)、(k)、(p)、(u)以及图2(c)、(h)、(m)、(r)、(w)中分割出来的最终结果。
3.2 结果分析
对比GBVS模型和Itti模型从复杂背景中分割出的QR二维码结果,从图2(d)、(i)、(n)、(s)、(x)和图2(e)、(j)、(o)、(t)、(y)所示的分割结果中可以看出两个模型基本上都完整的提取出了复杂背景中的QR二维码;对比图2(x)和图2(y)发现Itti模型较GBVS模型能够提取出更加完整的QR二维码。
为了进一步验证文中算法的有效性,引入分割误差和重合度两种客观评价指标,计算该实验得到的十幅图像数据,不同模型的分割误差和重合度如表1所示。
通过表1可以看出,GBVS模型获得的最低分割误差为0.93%,Itti模型为1.04%;GBVS模型获得的最高重合度为97.78%,Itti模型为96.79%;GBVS模型的平均分割误差为10.54%,Itti模型为10.39%,两者相差仅为0.15%;GBVS模型分割得到的平均重合度为87.14%,Itti模型为86.60%,仅相差0.54%;试验结果表明将视觉注意机制GBVS或Itti模型引入到复杂背景下QR二维码的图像分割可以有效去除复杂背景对QR二维码目标准确分割的影响。
4 结论
针对实际生活中各种场景下因复杂背景引起的QR二维码图像分割效果差这一问题,通过引入视觉注意机制模型,消除了复杂背景对QR二维码图像分割的影响,实现了复杂背景下QR二维码图像的完整分割。同时,GBVS模型和Itti模型的分割性能接近,均可有效的从复杂背景中分割出QR二维码目标区域。
摘要:QR二维码品质溯源的标识,在制造业中具有广泛的应用。提出了基于视觉注意机制GBVS和Itti模型的QR二维码分割方法,可以有效消除复杂背景对QR二维码高效识别的影响。实验表明,GBVS和Itti模型最终获得最小分割误差分别为0.93%和1.04%,最高重合度分别为97.78%和96.79%,平均重合度分别为87.14%和86.60%,相差仅为0.54%;该试验结果表明GBVS和Itti模型均能从复杂背景中有效分割出QR二维码,克服复杂背景的影响,有利于稳定快速识别QR二维码,同时验证了将视觉注意机制模型应用于复杂背景下的QR二维码分割的有效性、可行性。