二维条码识别算法研究论文

2024-05-20

二维条码识别算法研究论文(通用3篇)

二维条码识别算法研究论文 篇1

1 概述

目前, 二维人脸识别技术已经较为成熟, 但是因为其识别率会受姿态, 光线, 人脸的表情变化等外界影响而剧降甚至无法识别。

三维人脸识别是直接提取人脸空间信息, 克服了二维人脸识别的单一方向平面投影的所产生的缺点, 提高了系统精确性和鲁棒性。

本文是基于K-L算法的PCA二维人脸识别, 对三维数据模型的人脸识别问题展开了研究。在对三维人脸模型进行人脸几何特征与纹理特征的分别提取, 进行均值化处理后, 将三维人脸模型转换到一致的状态下, 最后用Matlab实现了具有高精度有效算法的识别。

2 基于K-L变换的PCA算法的二维人脸识别

根据主元分析的原理建立的特征脸算法是目前人脸识别领域最成功的算法之一。其核心为:用一组维数少的新变量代替旧变量, 新变量要最大程度的携带旧变量的信息以便于下一步的分析。

用训练样本的数据产生矩阵, 经K-L变换后得到一组特征向量, 由主特征向量形成脸的形状称之为特征脸, 由前K个最大特征值对应的特征向量所张成的空间称为人脸子空间。任何一幅人脸图像就可以用这K个特征脸的线性组合来表示, 其加权系数即是K-L变换的展开系数。人脸识别就是将待识别人脸投影到特征空间, 根据欧氏距离确定最佳匹配。K-L变换的PCA算法的二维人脸识别的步骤如下:

(1) 求出图像特征的协方差矩阵Sx。

其中E (X) 是期望算子;N为图像空间的维数;T表示转置运算, 且SX∈IRN×N。

(2) 求出Sx的全部特征值1λ, 2λ, …, λD和对应的特征向量1u, u2, …, uD。将特征值按从大到小的顺序排列, 特征向量也按对应特征值的顺序排序。

(3) 当前d个主成分已经能够反映整个样本特征时, 就可以只取前d个主成分作为新的特征, 这时有

后面的D-d个新特征可以舍去, 从而达到降维的作用。

3 基于二维PCA的三维人脸识别算法

在K-L的二维PCA算法的基础上, 将其推广至三维, 混合纹理特征与几何特征实现三维人脸识别, 提高了人脸识别的准确度。

3.1 三维几何特征提取

获取N幅图像的几何特征坐标点。若将训练集中第i幅图像的第j个特征点的坐标记为 (xij, yij) , 则可用向量来表示训练集中第幅图像中形状的个特征点:

通过对特征点标定可得到一组向量集Si, 它由N个向量组成, 其中1≤i≤N。这样所有图像的形状最终由一个特征点向量组Si来表示, 以达到特征提取降维的效果。

本文采用最高的鼻尖及其周围10000个点作为图像的特征矩阵, 对图像进行人脸识别。

3.2 三维纹理特征提取

人脸的纹理通常是指人脸表面像素的灰度值分布信息。形状模型建立之后, 将所有的样本图像向平均形状进行纹理映射, 然后在平均形状中实现纹理的采集。这样可以消除样本图像中的人脸因位置、姿态和尺寸等差异带来的影响。对位于W (x, p) 的点进行像素灰度采集, 即得到该点的纹理信息。对平均形状中的每一个点进行相同的操作, 从而得到整幅人脸在平均形状模型中的纹理向量 (纹理图像) , t= (t1, t2, ⋅⋅⋅, tm) Tm为采集的像素个数。

3.3 建立三维人脸主动可变形模型

三维人脸主动可变形模型同时考虑人脸的几何和纹理信息, 将原始三维人脸的几何和纹理分别表示成一个几何向量和纹理向量。但是, 由于不同人脸的个性化差异, 扫描得到的三维人脸数据有很大的差别。因此, 建立三维人脸主动可变形模型.首先要对原始扫描的三维人脸数据进行规格化处理, 建立三维人脸顶点之间点对点的对齐, 以使用统一的向量形式来表示三维人脸数据。原始的三维人脸数据在经过点对点的对齐处理后, 就可以用统一的形状向量和纹理向量来表示:

其中Si, 是由第i个三维人脸顶点的三维坐标组成的几何形状向量。iT是由三维人脸几何形状向量中对应顶点的纹理R, G, B值组成的纹理向量。N是三维人脸的个数。n是构成三维人脸的顶点个数。

然后, 采用主成分分析的方法对三维人脸的形状向量和纹理向量分别进行处理, 即可建立三维人脸主动可变形模型:

其中, 向量Smodel和向量Tmodel分别表示三维人脸空间中的任意形状向量和纹理向量, 为模型的组合参数。

4 三维人脸识别Matlab实现

基于PCA算法, 我们用MATLAB编写出三维人脸识别的代码。根据数据计算其平均人脸, 根据协方差矩阵计算其特征向量, 将所有样本进行训练。读入待检测的人脸, 在对其进行几何和纹理特征矩阵分离后, 用PCA方法得到特征向量, 将此与原样本数据库中人脸进行比较, 得到较小距离的即为最佳匹配人脸。实验在CASIA的三维人脸数据库上进行。我们取其中的25个不同个体, 每个个体取20张图片。图片包含个体正面, 侧面, 具有不同的光照条件, 面部表情和姿态。

在CASIA人脸数据库中, 使用5幅训练且维数为40时, 二维PCA人脸识别的准确率为86.4%, 但是当测试图片不是标准型时或受到遮挡时, 准确率骤降到60%以下, 有时甚至无法识别成功。所以二维人脸识别在规范取样的情况下其结果才具有可信性, 但在日常生活中要取到规范样本的可行性不大。

三维PCA人脸识别在同样的情况下的准确率为89.5%, 虽然相比二维人脸识别的准确率没有较大提高, 但是三维人脸识别可以克服二维人脸识别所具有的易受外界干扰如扭转角度所带来的识别失败的缺点。

5 结论

二维人脸识别算法实现简单, 但会受到图像成像条件的影响导致识别率骤降。三维人脸包含有较二维人脸图像更多的信息, 挖掘三维人脸的有用信息, 可以在一定程度上克服二维算法中姿态和光照变化等的影响。

本文正是基于人脸识别中存在的上述问题, 提出了基于PCA的三维人脸算法, 并给出了相应的实验结果。

影响人脸识别系统性能的因素很多, 针对该套算法还有许多值得研究和改进的地方。我们在搭建的人脸识别程序的功能也需要进一步的完善和增强, 应再增加更多的样本信息, 这样就可以识别更多的待测人脸和检验算法的准确度及快速性, 同时三维人脸识别由于处理的数据量庞大, 耗时相对较长。如何优化算法, 提高运算速率, 也成为我们今后的研究学习的方向。

参考文献

[1]孔华锋, 鲁宏伟, 冯悦, 基于二维Gabor小波特征的三维人脸识别算法[J], 计算机工程, 2008年9月.

[2]王成章, 基于三维模型的人脸识别算法研究, 北京工业大学[D], 2008年5月.

[3]程自龙, 雷秀玉, 基于K-L变换 (PCA) 的特征人脸识别方法综述, 中国科技论文在线.

[4]尹宝才, 张壮, 孙艳丰, 王成章, 基于三维形变模型的多姿态人脸识别[J], 北京工业大学学报, 2007年3月.

二维条码识别算法研究论文 篇2

最近几年,我国信息技术与网络技术得到了较快发展,当前已经普遍应用于社会各个领域当中,对人们的生产生活产生了重要影响。很多单位为了提高工作效率及服务水平,相继购置了电脑、服务器、交换机等大量设备,在有效提高了工作效率的同时,也给设备管理带来了较多的问题。在过去较长时期内,设备管理主要以手工管理为主,人力投入多、而且需要耗费大量的时间,提高设备管理效率是摆在当前各个单位面前的主要任务。自二维码技术出现以来,不但为提高设备管理效率带来了机会,同时作为一种新型信息载体和自动识别技术,在设备管理方面可以发挥更大的作用。

1二维码技术发展现状

二维码技术就是利用黑白相间的平面图形,依据一定规律排列几何图形用以表示数据信息的一种先进识别技术,国外关于此方面的研究较早,在上世纪八十年代即已出现,我国随即在此方面投入了大量的人力物力进行研究,推动了二维码技术的快速发展,收到了较好的效果。我国当前移动网络发展速度迅猛,人们的生产生活已离不开二维码技术,在人们的工作生活中发挥的作用越来越大。二维码技术与传统条形码技术相比拥有的优点更为全面。第一,在记录信息方面,利用条码技术可以记录一定的信息,而利用二维码技术则可以记录比条码高几十倍的信息,二维码不但可以记录物品的种类,而且也可以记录物品的详细内容,可以满足人们读取物品详细信息的需求。第二,二维码只需占用更小的空间,尤其可以普遍应用于小型工具方面,大大拓宽了二维码的使用范围,而且制作二维码也更为简单,当前网络上存在着大量的二维码生成器,只需在网上下载就可使用,不需投入大量资金。第三,二维码有着比条形码更高的安全性能,而且更容易识别与读取,其应用范围更大,准确率更高。

2设备管理中引入二维码技术的优势

自上面论述可以发现在设备管理中引入二维码技术有着更多的优点,如果各单位在设备管理中全面应用二维码技术可以提高自身管理水平,得到人们的认可。

2.1缩短录入时间简化调试程序

单位在购置设备后,第一个环节就是信息录入,但设备信息录入人员有时在购置设备方面并不具备专业知识,在登记信息时难免会出现不准确现象,为单位以后的设备管理造成了极大的安全隐患。再有,为了保证设备的稳定运行,单位会定期开展全面检查工作,不但大大增加了运行成本,而且在检查期间需要停止设备的运行,占用大量的工作时间,给工作带来了极大不便。而如果登记人员利用二维码技术则可以准确快速录入设备信息,与自身专业技术知识关系不大,利用二维码扫描器直接扫描设备的二维码,就可在电脑上看到设备的详细信息,复制即可。再有,在购入大型网络设备后还需迅速进行设备的调试。过去常用的调试做法需要工作人员掌握设备的实际性能,对工作人员的专业技术要求较高,如果不能掌握设备的详细配置,那么就需厂家技术人员前来指导调试,不但耗费了大量的人力物力而且也需占用大量的工作时间。而在设备调试中引入二维码技术,厂家可把用于调试的各种详细数据制作成二维码,随设备进入单位,调试工作人员只需利用二维码扫描器扫描产品上的二维码,就可得到设备的详细配置信息,顺利进行设备的调试工作,不但节约了大量的人力物力,而且减少了工作时间。

2.2易于检修

当前很多单位的办公已实现了信息化,利用网络设备可以收到较好的效果,但同时需要面对的是设备的运行维修工作,只有及时做好设备的运行维修才能保证设备的正常运行。开展设备日常维修就是在设备出现故障但还可以运行时,迅速明确出现故障的部位与部件,及时进行修理。当前应用的网络大型设备通常购置时需投入大量资金,为了节约资金,通常都是更换其中出现故障的零部件,而不能成套更换设备。但遇到的问题是这些零部件的信息在整个设备信息中不会显现,有时只能找到一个编号,检修人员在此会遇到较多困难。所以对于使用部门来说,应在设备购置前要求厂家将设备中的各个零部件的全部信息制作成二维码,主要涉及零部件的编号、规格、购置时间、产品性能等,可以贴在设备的相应位置,检修人员在检修过程中只需扫描相应部位的二维码就可得到零部件的全部信息,可以迅速找到出现故障的部位,使设备的检修工作变得简单。

2.3简化更换

单位引入设备投入使用后,经过一段时间的运行有的备件就会出现问题需要及时更换。在过去较长时期内,工作人员在更换备件时首先要找到出现故障的备件,为了找到出现故障的备件要将设备全部分解,更换完毕后再进行组装,需要投入较多的工作时间。再有,在明确出现故障的备件后,因为不了解备件的详细信息,还需查找资料询问厂家等,又需耗费一定的人力与时间。利用二维码技术可以有效提高更换备件的效率。二维码技术不但可以录入丰富的信息而且也可以处理其中的信息,可以为工作人员提供丰富的备件信息,检修人员在更换过程中不必分解全部设备只需依据一定的顺序检查与更换即可,大大缩短了更换备件时间。二维码中包含着详细的配件信息,维修人员只需扫描二维码就可迅速明确出现故障的部位,不需再去查找资料与询问厂家。

3结语

总之,在设备管理中引入二维码技术极大方便了设备的管理与检修,与条形码技术相比,二维码有着更多的有利条件。尤其体现在设备的调试、检修、更换配件等各个方面可以有效缩短操作时间,节约了大量的人力物力,展望将来,二维码技术在设备管理中必将得到普遍应用。

参考文献

[1]张霁明,吴设军.基于二维码技术在电力二次设备中应用分析[J].电子世界.2017(01)

大数据下的实体识别算法研究 篇3

关键词: 数据质量 数据清洗 实体识别

1.引言

在现实信息应用系统中如:多媒体、社交网络、物联网等诸多领域每天都积累了ZB级的大数据,这些数据具有规模庞大、涌现的速度快、可挖掘的价值大等特点,但同时有大量劣质数据存在,这些数据具有重复性、不完整性、陈旧性等特点。有关大数据质量的系列问题已经引起产业界和学术界的关注和重视。劣质数据降低了信息的可用性,给用户提供错误的信息,误导用户做出错误的决策,从而给用户造成损失。统计数据显示,50%以上的数据仓库项目由于数据质量问题而不得不取消或延迟。在典型的信息系统项目中,时间和成本预算的30%~80%实际用于清理数据而非系统开发。专家估算目前数据质量问题平均给每个企业增加的成本是企业收入的10%~20%。

目前,并没有统一的数据质量的定义形式。有关文献从六个维度阐述了数据质量的定义标准,包括:精确性(accuracy)、完整性(completeness)、时效性(timeliness)、一致性(consistency)、实体同一性(entityidentity)及相关性(relevancy)。其中,实体同一性指的是数据同应用需求的契合程度,描述同一个现实世界事物的数据冗余程度。实体识别在数据质量管理中有重要作用,是数据质量管理的主流研究方向之一。本文主要从针对各种数据模型总结数据质量中实体识别的算法的相关工作,并就其中的相关算法展开论述。

2.实体识别问题

大数据中的实体识别是指在给定的大数据集中准确发现属于同一实体的不同记录并将其聚类,使得每个实体簇在现实世界中表示同一对象的过程。实体识别是提高数据实体同一性方面质量的关键步骤。从形式化角度定义实体统一性:给定一个数据实体的集合D和一个物理实体集合O,求解一个集合D的划分P(其中P是由一系列D的不相交子集合构成,且P中所有集合并的结果与D相同)及P与O之间的一一对应关系。在实际应用中,数据实体D很容易获得,而物理实体集合O很难获得。因此在数据量大的情况下评价给定实体解析算法的优劣非常困难。也就是说,只要求将表示同一物理实体的数据实体放入一个集合,而不要求建立P与O之间的关系,该问题则称为实体识别问题。因此,根据实际具体的需求,借助不同的方法学,针对适合的问题定义,给出系统的解决方案。

在不同的应用领域,有不同的方法描述实体识别的过程。在单数据源中,内部实体使用唯一标识符或特征属性精确匹配来区别。在分布式系统中,由于不同的设计目的和角度,现实世界中的同一个实体也不可能有相同的标识符或者是相同的特征属性,因此,必须采样合适的方法实现实体识别。

3.实体识别过程

实体识别包括预处理阶段、特征向量的选取、比较函数的选取、搜索空间的优化、决策模型的选取和结果评估六个阶段。

预处理阶段是实体识别过程的关键阶段,在该阶段中要实现数据的标准化处理包括空格处理、字符大小写转换、复杂数据结构的解析和格式转换、上下文异构的消除等。隐马尔科夫模型是在该过程中对数据进行标准化处理的常用方法。

特征向量是指能够识别实体的属性的集合。特征向量的选取方法包括领域专家手工指定和机器学习方法。决策模型是在搜索空间中进行特征向量比较中判断实体是否匹配的决策模型的选取。一种是概率模型如Fellegiandsunter模型,另一种是基于经验的模型,根据领域专家的经验设置门限值。

评估结果有匹配、不匹配和可能匹配。不能确定的匹配结果需要人工进行评审,对评审过程中发现的问题进行调整或者改进决策模型,以期获得更高精度的实体识别效果。

4.实体识别相关研究

早期的实体识别算法主要是利用记录之间的相似性进行比较,运用规则的方法和阈值确定两条记录是否为同一个实体。在机器学习方法中动态生成相似性函数获取一个分类器,有效结合多个属性的相似性并且较准确地判定每对记录是否能被匹配为同一实体。基于规则的方法是根据规则确定不同记录是否描述同一实体。有学者提出了一个基于Map-Reduce框架的大数据实体识别算法,该算法首先通过属性值计算记录间的相似程度,而后基于图聚类的方法实现实体识别。

复杂数据是指在现实应用中产生的如XML数据、图数据和网络数据等。同一实体具有不同的复杂的数据描述方式,为了有效对这些数据实施质量管理,必须对复杂数据进行快速有效的实体识别。复杂数据上的实体识别可以分为成对识别和成组识别。根据识别对象的不同,复杂数据的实体识别分为XML数据实体识别、图结构数据实体识别和复杂网络中节点的实体识别。

5.大数据下的实体识别算法展望

单数据源的实体识别算法已经趋于成熟,但在大数据环境下的实体识别技术还是比较少。同时,针对大数据环境下的复杂结构数据的研究刚刚起步,海量复杂数据上的实体识别技术,特别是图数据上的实体识别技术的研究还处于初级阶段,大规模图集合上的数据实体识别的工作尚未开展。

需要支持更新复杂数据上的实体识别技术,不断更新互联网、社会网信息要求设计更新纷繁复杂数据上的增量实体识别技术,为更新的数据确定其所描述的实体。

6.结语

多类型的复杂数据要求设计实体识别技术。对互联网信息、进行有效的查询、集成和分析需要多类型复杂数据的实体识别技术。

参考文献:

[1]王宏志,樊文飞.复杂数据上的实体识别技术研究[J].计算机学报,2011,34(10):1843-1852.

[2]霍然,王宏志,等.基于Map-Reduce的大数据实体识别算法[J].计算机研究与发展2013,11:170-179.

[3]刘显敏,李建中.实体识别问题的相关研究[J].智能计算机与应用,2013,2(3):2-4.

[4]李明达,王宏志,张佳程,等.PEIF:基于并行机群的大数据实体识别算法[J].2013,11:211-220.

[5]张建中,方正,等.对基于SNM数据清洗算法的优化[J].华南大学学报:自然科学版,2010,41(6):2240-2245.

上一篇:现代西方哲学下一篇:沉默论