图像文字识别论文

2024-07-03

图像文字识别论文(共7篇)

图像文字识别论文 篇1

0 引言

社会发展进入信息时代, 随着实践活动的扩大、深入和社会化需要, 人类需要去识别很多类的形式内容复杂的信息。人们已经不再停留在自己的耳朵和眼睛去直接获得这些信息, 而是使用计算机将文字自动的输入计算机。由于科技水平不断提高, 使得各种不同的研究对象得到“图像化”和“数字化”, 以图像为主的多媒体信息迅速成为重要的信息传递媒介, 图像中的文字信息包含了丰富的高层语义信息。提取出这些文字, 对于图像高层次语义的理解、索引和检索非常有帮助。

现在对于文字图像识别技术的研究[1], 还面临几个问题, 一是图像数据量大, 一般来说, 要取得较高的识别精度, 原始图像应具有较高的分辨率, 至少应大于64×64。二是图像污损, 由于目标环境的干扰、传输的误差、传感器的误差、噪声、背景干扰、变形等会污损图像。三是准确性, 位移、旋转、尺度变化、扭曲, 和人类的视觉一样, 目标和传感器之间存在有位置的变化, 因此, 要求系统在目标产生位移、旋转、尺度变化、扭曲时, 仍能够正确识别目标。四是实时性, 在军事领域的应用中, 大都要求系统能够实时的识别目标, 这就要求系统有极快的出来速度和识别效率[2]。

鉴于当前文字识别系统的发展现状[3,4], 如何提高印刷体文字的识别率仍是当前的研究热点, 如何在世界场景下识别文字将是文字识别系统发展的一个方向。此外, 如何构建具有版面自动分析、容错性强、识别率高、错误自学习自修正、易扩展特点的文字识别系统是文字识别自动化的研究目标[5]。所以, 图像文字识别技术的研究显得尤为重要。

1 图像预处理

1.1 图像的灰度转换

在文字识别系统[6]中, 输入系统的图像一般都是彩色RGB图像, 其包含了大量的颜色信息, 要是对图像进行处理会降低系统的执行速度, 加之RGB图像包含有很多与文字识别无关的颜色信息, 不利于文字的定位, 而灰度图像, 只包含亮度信息, 不包含色彩信息, 有利于文字识别系统后期对图像进一步的处理[7], 可以提高运行速度, 有利于下一步的文字定位。由于人眼对绿色最为敏感, 对红色的敏感度次之, 对蓝色的敏感度最低, 所以当在b>a>c的条件下, 可以得到较易于识别的灰度图像。一般情况下, I=0.3*R+0.59*G+0.11*B, 得到的灰度图像的效果最好。因此, 本文采用加权平均值方法进行灰度转换, 即对R、G、B的值加权平均:

R=G=B=a*R+b*G+c*B

其中, R、G、B分别表示红色、绿色和蓝色, a, b, c分别为R、G、B的权值。a、b、c取不同的值, 将形成不同的灰度图像。

1.2 图像的二值化

图像的二值化处理[8], 是对图像上的像素点的灰度值置为0或255, 即当所有灰度大于或等于阀值的像素点被判定为特定的物体, 其灰度值为255, 否则, 其灰度值为0, 表示其他的物体区域或者背景, 处理后的图像将呈现明显的黑白效果。图像的二值化, 可以将具有256个灰度等级的灰度图像经过合适的阀值选取后, 将像素的灰度级分成2级。经过二值化处理后的图像, 其性质只与灰度值为0或255的像素点的位置有关, 不再涉及到其他灰度极的像素点, 便于对图像作进一步的处理, 且数据的处理量和压缩量较小, 且获得的二值化图像仍旧可以反映图像整体与局部的特征。

为了得到理想的二值化图像, 阀值的选取至关重要。选取适当的阀值, 不仅可以有效地去除噪声, 而且可将图像明显地分成目标区域和背景, 大大减少信息量, 提高处理的速度。

2 文字区域处理

当包含文字信息的图像区域分割出来以后, 为了识别单个文字, 需要进一步将每个汉字从整块文字图像中分割出来。根据汉字是方块图形、具有大致的均匀尺寸的特点, 本文使用了最大宽度回归式字切分法, 利用在行切分时获得的汉字高度信息估计字的宽度, 以预测下一个汉字的位置。

3 特征提取

抽取单一种类的特征进行汉字识别[9,10], 误识率不易降低, 且抗干扰性也不易提高。因为这样所利用的汉字信息量有限, 不能全面反映汉字的特点, 对任何一种特征来说, 必然存在其识别的“死角”, 即利用这种特征很难区分汉字。从模式识别的角度来看, 若将汉字的全部矢量化特征所组成的空间称作空间 (i=1, 2, ...) , 那么利用整个空间的信息进行汉字识别, 由于提供的汉字信息很充分, 抗干扰性会大大增强。但是, 在实际应用中, 必须考虑到识别正确率与识别速度 (运算量) 及系统资源三者的折衷。所以任何一个实用的OCR系统只利用其中部分子空间的信息。由于信息的缺陷, 便不可避免地遇到识别“死角”的问题。

在这些方法研究的基础上, 我们选择了汉字的网格特征和方向特征进行汉字识别, 这些特征具有较强的抗干扰能力, 又有较强的描述文字局部结构的能力, 而且受笔画宽度的影响较小, 相得益彰, 使汉字识别的“死角”大幅减小, 从而提高识别率。

(1) 网格特征

将汉字点阵平均分成m×m份, 求出每个网格中黑点数所占整个文字黑点数的百分比。这样组成的一个m×m维的序列就是该文字的网格特征, 它体现了文字整体形状的分布。

网格特征的提取过程如下:

1) 设文字点阵为n×n, 将其分成8×8份。

2) 求出每份中的黑点数, 用P11, P12, …P18, P21…P88表示。

3) 求出文字总的黑点数P=P11+P12+…+Pl8+P21+…+P88。

4) 求出每份中黑点数所占整个文字黑点数的百分比Pij=Pij×100/P。

则特征向量P= (P11, P12, …P18, P21…P88) , 就是文字的网格特征, 如图3。

(2) 方向特征

对输入的文字点阵图像进行二值化和归一化, 并提取轮廓信息, 对轮廓上的每个点赋予一个或两个方向的属性, 方向取水平、垂直及正反45°共四个角度, 将文字点阵划分为n×n个网格, 计算每个网格中包括的4个方向属性的个数, 从而构成一个4维向量, 综合所有的网格特征, 形成一个4×n×n维的特征向量, 如图4。

4 分类器设计

经过多次试验与研究, 结论表明基于单个识别器原理不能从根本上提高系统性能, 应依靠多个分类器的识别结果的集成。多分类器集成即通过多个互补的分类器来改善单个分类器的性能, 得到一个可靠性更高的识别系统[11]。因此, 本作品采用最小距离分类器及最邻近分类器集成, 通过分类器设计上的优化, 进一步提高了文字的可以别率和准确率。

(1) 最小距离分类器:选用笔画密度总长度特征来进行第一层的粗分类。在这种方法中, 被识别模式与所属模式类别样本的距离最小。假定c个类别代表模式的特征向量用R1, …, Rc表示, x是被识别模式的特征向量, |x-Ri|是x与Ri (i=1, 2, …, c) 之间的距离, 如果|x-Ri|最小, 则把x分为第i类。

(2) 最邻近分类器:分别选用网格特征和方向特征相结合来完成第二层的分类匹配。最近邻分类器是在最小距离分类的基础上进行扩展, 将训练集中的每一个样本作为判别依据, 寻找距离待分类样本最近的训练集中的样本, 以此为依据来进行分类。

5 实验结果

在实验部分, 本文使用包含697个汉字的原始图像来进行测试。首先把该原始图片转化为灰度图像以便进行下一步的操作。通过回归式字切分法把整段文字分割成单个的字体, 测试效果如图5, 可以准确地分割每个汉字。最后, 采用多特征提取和多分类器集成的方法识别分割出来的文字, 并以文本框的形式输出, 测试结果如图6, 结果全部正确。

6 结语

多特征提取方法及多分类器集成方法使提高图像文字识别率成为可能, 其良好的识别效果引起了人们的普遍重视, 具有广阔的应用前景。本文基于多分类器集成方法实现图像文字识别, 使图像文字信息的处理及提取更具可行性。

摘要:本文本主要对图片文字提取展开研究, 首先读取图片进行预处理;然后针对网格特征和方向特征对图片文字进行特征提取;为了提高识别系统的可靠性, 采用多分类器集成方法, 即通过多个互补的分类器来改善单个分类器的性能。

关键词:图像文字识别,特征提取,多分类器集成,印刷体汉字

参考文献

[1]M.A.Smith and T.Kanade.Video skimming and characterization through the combination of image and language understanding.In International Workshop on Content-Based Access of Image and Video Databases[J].San Juan.Puerto Rieo, 1997, 95 (186) :61-70.

[2]A.Jain and B.Yu.Automatic text loceation in images and video frames.Pattem Reeognition[J].1998, 31 (12) :2055-2076.

[3]C.Gareia and X.APostolidis.Text detction and segmentation in comlex color images[J].Proeeedings of 2000 IEEE International Conference on Acoustics, Speech and Signal Processing, Heraklion, 2000, 4 (6) :2236-2329.

[4]HE Lin, RUAN Weitong, ZHANG Mei, et al.Survey on Hyperspectral Imagery Classification with Support Vector Machine[J].The Journal of New Industrialization, 2012, 2 (1) :46-51.

[5]杨友庆, 高隽, 鲍捷, 等.基于视频的字幕检索与提取[J].计算机应用, 2000, 20 (10) :33-36.

[6]何家颖, 黎绍发.一种复杂背景图像文字分割算法[J].模式识别与人工智能, 2005, 18 (2) :148-153.

[7]梁涌.印刷体汉字识别系统的研究与实现[MA].西北工业大学硕士学位论文, 2006.

[8]倪桂博, 印刷体文字识别的研究[MA].华北电力大学硕士学位论文, 2007.

[9]聂玖星.印刷体汉字识别系统的特征提取和匹配识别研究[MA].大连理工大学硕士学位论文, 2008.

[10]黄弋石, 梁艳.手写识别建模数学方法研究[J].软件, 2013, 34 (8) :13-15.

[11]张环, 赵亚妮, 杨晓波.一种基于SVM的视频检索反馈算法[J].软件, 2013, 34 (3) :69-71.

图像文字识别论文 篇2

K-means聚类算法是当前常用的基于划分的分类算法, 能够按照既定标准与要求将集合进行划分。在数字图像文字提取与识别中, 可以通过对数字图像进行灰度处理, 将文字背景与文字前景用不同的灰度像素来表示, 并使用K-means聚类算法进行像素划分, 从而将文字从数字图像中提取出来, 作为OCR识别的图像输入。

2 K-means聚类算法基本原理

K-means聚类算法的基本思想是利用集合元素之间的距离为划分标准, 在集合内部按照元素的分布密度的不同将元素划分为不同的子集合。在划分过程中, 通过定义元素之间的距离, 按照元素到聚类中心之间的距离最小原则将元素进行聚合, 从而得到最终的划分结果。主要包括以下几个步骤: (1) 根据元素划分的基本要求, 从集合元素中随机选择k个元素作为划分结果的中心元素, 并针对集合中的每个元素计算其到聚类中心元素的距离大小, 并按照最小距离原则把各个元素划分到对应的聚类中心元素集合中; (2) 按照划分结果对各个子集合中的元素计算特征均值, 并根据计算结果对划分结果进行更新操作; (3) 对更新后的子集合元素再次按照第一步中的方法进行聚类操作, 从而得到更新后的元素划分结果; (4) 按照上述步骤进行循环计算, 当两次计算所得到的的聚类中心元素相同时, 所得到的划分结果即为聚类结果。

K-means聚类算法的基本流程比较固定, 其本质是在给定集合元素距离计算方法后, 不断进行聚类迭代与循环运算对元素进行聚类划分, 在应用过程中只需要定义合适的距离计算方法即可将K-means算法转化为软件程序进行上机运行。采用K-means聚类算法的缺陷主要是在选择聚类中心元素时, 算法受到样本元素的选择随机性和外部噪声的影响比较显著, 如果不进行有效的算法优化则比较容易导致算法陷入局部最优, 因此在采用K-means的图像文字提取与识别处理中需要根据图像特征对算法进行改进与优化。

3 算法流程设计

3.1 图像预处理

在本文提出的图像文字处理算法中, 对数字图像进行的预处理包括图像灰度转换、二值化处理、文字块定位以及文字边缘检测等:

(1) 图像灰度转换是将彩色图像转化为仅包含像素亮度信息的灰度图, 并将数字图像中的背景冗余信息与其他噪声进行去除。数字图像文字提取与识别中的噪声主要是由于外界光照、颜色等因素导致的图像有效信息受到干扰所产生的, 因此噪声去除主要采用了滤波方式, 包括领域平均滤波法及中位值滤波法等, 将数字图像像素中的噪声去除。

(2) 二值化处理是将黑白图像中的背景与前景进行, 一般采用灰度像素阈值分离法来进行, 包括全局域阈值分离法、局部阈值分离法及动态可变阈值分离法等。由于动态阈值分离法的计算量大、处理效率低、分离效果较差, 所以本算法采用局部最优阈值分离法, 通过计算图像不同区块中像素的灰度梯度值变化对像素进行分离。

(3) 边缘检测处理将经二值化后的图像进行特征区域划分, 通过检测数字图像灰度变化、颜色变化及纹理特征的变化差异, 实现文字块与背景的分离。本算法的边缘检测算法中采用了一阶以及二阶微分算子来进行像素灰度导数值的计算, 实现不同区域的边缘检测。

3.2 聚类处理

经过图像预处理之后即可采用K-means聚类算法进行文字提取。通过对像素进行聚类处理, 可从图像中提取到待识别文字目标区块, 详细流程包括:

(1) 对数字图像进行像素空间分类, 将其划分为N个子簇, 并在每个像素簇中随机选择一个像素作为中心点;

(2) 采用欧氏距离作为像素距离的计算方式, 计算N个像素簇中各像素点到中心点的距离, 并按最小距离原则进行像素聚类, 得到N个像素点子集合, 记为Pi (n) ;

(3) 随机选择像素子集合Pk和Pm, 计算集合之间的最近距离, 随后将Pk中距离Pm最近的像素点归入Pm集合, 并从Pk中删除;

(4) 重新计算经过上一步处理后得到的N个像素子集合的中心点, 重复上述过程直到各个像素子集合不再发生变化;

(5) 对N个像素子集合计算灰度均值, 并以灰度值作为各个像素子集合的标记, 采用局部聚类分类法得到最终的聚类结果。

3.3 图层选择与优化

由于图像文字的中心特性, 可通过计算图层像素点距离中心区域的距离得到最终选择的图层。在算法中为了提高图层选择的准确度, 首先将图层集合按中心距离大小分为两个子集合。并采用连通域分析、像素噪声去除等操作, 选择距离最小的图像图层作为最终的选择结果, 在此图层中包含了要提取与识别的文字块。

3.4 文字切分

在经过阈值分割后得到的图像区域中还包含了部分不属于文字区域的像素点, 所以需要对噪音像素进行去除处理, 经过切分处理后得到最终可被OCR识别的文字图像, 主要步骤主要包括:

(1) 将文字处理结果中明显不符合文字高宽比的像素进行去除;

(2) 定义文字块的边缘密度, 根据文字块边缘密度通常大于0.2的特征去除噪音;

(3) 将处理结果中区域面积小于10个像素点的区域去除;

(4) 对处理结果中的像素块进行融合, 得到文字块。

通过算法上机仿真测试表明, 本文提出的算法对数字图像中的文字区域定位比较准确, 在文字排列比较复杂的情况下, 算法的定位准确度保持在95%以上。

4 结语

通过对K-means算法进行分析, 结合数字图像的灰度处理、二值化、边缘检测等技术, 设计了基于聚类的图像文字处理算法, 能够很好地对复杂数字图像背景中的文字进行定位与提取, 得到可被OCR识别的图像, 具有较高的执行效率与准确度。

摘要:K-means聚类算法作为最常用的集合元素划分算法, 在数字图像文字定位、提取与识别中有着广泛的应用。文中针对当前图像文字识别与提取的最新发展状况, 提出一种基于K-means的图像文字识别与提取算法。经过上机测试, 该算法能够有效提高图像文字识别与提取的准确率与执行效率。

关键词:K-means,图像文字提取,文字识别,OCR

参考文献

[1]种耀华.基于NSCT图像文字信息提取新方法[J].计算机应用, 2012 (S2) .

图像文字识别论文 篇3

关键词:文字识别,模式识别,应用,科技信息技术

随着高科技信息技术的快速发展, 计算机技术在存取信息、输出和高速运算等方面得到了不断的完善和健全, 但目前计算机的信息输入还是主要依靠人工, 文字识别中的模式识别技术主要是运用大脑识别机理通过计算机的模拟工作, 从而构造出一个完全能够代替人工完成分类的识别等工作, 以达到实现自动信息处理的机器系统的目的[1]。随着人工智能、思维科学和计算机技术迅速发展, 在文字识别领域的模式识别技术也在不断的向更深、更高层次发展。模式识别主要是由模糊理论、统计、神经网络、句法结构以及支持向量机识别等方法, 笔者就文字识别领域的中模式识别的应用原理做出分析。

1模式识别系统的基本概念

人们在看到某个事物和现象时会不自觉的收集该事物或现象的相关信息, 并将该信息与大脑中已经储存的信息进行匹配或比较后得出相应的结果。对该事物或现象中所获取到的时间及空间信息将其统称为模式。而将模式中同一类别模式统称为模式类[2]。当需要将具体的样本进行归类时就叫做模式分别或模式识别。模式识别系统通常由四部分组成, 分别为数据获取、数据预处理、数据的特征提取及选择和分类决策。数据获取指的是把输入模式切换成适合计算机处理形式的一个过程。数据预处理主要是将多余的噪音去除, 从中提取需要的信息, 通过专业的输入设备对残缺的信息进行必要的修复和处理, 以便于计算机提取特征, 在通过数据获取和预处理后输入信息的数据维数较高, 为了达到分类识别的目的, 对原始数据进行处理过程中, 通过相互的转换从数据中提取出最原始的模式特征。原始数据空间又可以被称为测量空间, 而分类识别都是在一个称为特征空间中进行的。所谓的模式识别系统指的是在测量空间模式中, 维数由低向高的转化的过程, 这也是该系统通常采用的特诊提取及特诊选择。文字算法是文字识别的关键和核心。

2 模式识别技术的应用方法

2.1 统计识别

在数学决策理论的基础上, 产生了一种新的识别方法, 也就是统计识别方法。在进行特征提取时, 就可以采用统计识别的方法, 这时可以将相应的特征向量通过一个特征空间进行定义, 全部的特征矢量都在这个特征空间内。这个特征空间的点都能与各种对象及特征向量之间进行对应。在分类阶段中, 通常采用统计决策的方法完成对特征空间信息的分类, 以此来达到对各类特征对象识别的目的效果。随着科学技术的进步, 我国的统计识别技术已经逐渐成熟, 尤其是对特征提取的识别。

2.2 模糊识别

模糊识别的方法主要是采用模糊数学的原理、概念和方法解决分别识别中存在的问题。模糊识别根据识别事物逻辑思维与吸取大脑识别的特征, 把计算机中的二位逻辑不断地向连续逻辑进行相关的转化。模糊识别的结果根据已经被采用被识别对象所属于的某个类别程度, 也就是隶属度得出结果, 一个对象可以适应于不同的类别或不同程度的类别。通常情况下, 一个对象只可以对应某一个类别。单模糊集理论就是将识别方法按模糊聚类法、择近原则识别法或最大隶属原则识别法分为多个类别[3]。

2.3 神经网络识别

20世纪50年代, 一些相关技术人员对动物神经系统的某些功能进行了研究分析, 并对其进行模拟, 他们通过使用计算机技术对大量的数据进行处理, 从中实现了处理单元结点的建立, 这种单元的出现为互联拓扑网络的建立提供了依据, 被称之为人工神经网络[4]。人工神经网络可以将不同的处理单元进行互连成为一个网络, 在进行识别分类的过程中, 能够通过网络对人的神经系统进行相关模仿, 从而实现分类的效果。这种网络识别方式相比于其它识别方法存在较大的差别, 人工精神网络对识别的对象不需要要求有过多的认识和分析, 并且可以实现智能化处理。神经网络可以实现和模拟人认知过程中的形象思维、感知觉、分布式记忆、自组织与自学习, 同时神经网络识别方法和符号处理之间可以实现互补的作用, 主要用于有处理需求且要考虑诸多条件和因素, 信息模糊或不精准的信息处理。

2.4 句法结构识别

句法识别是统计识别的基础上进行的延伸和补充, 统计识别主要是通过利用数值对图像的主要特征进行相应的描述, 而句法结构识别主要是通过符号的特征描述图像。而句法结构识别通过对语言学中句法层次结构进行一定的模仿, 通过利用分层描述的技术对图像进行层次分解, 从中获得较为简单的子图像, 这种识别方法体现出了识别对象各层次的信息。图像识别的方法也是在统计方法的基础上进行的延伸, 而句法结构识别方法的识别能力较图像识别的识别能力明显提升, 句法结构识别不在是单纯的对象物进行归类处理, 对物体结构和景物同样具备识别能力。

2.5 支持向量机的模式识别

支持向量机的核心思想主要是在特征或样本空间中打造一个最优的超平面, 而这个最优超平面与各种类样本集之间的距离最大, 就是要使其达到最大的泛化能力。支持向量机具有泛化能力强、结构相对简单、全局最优性等特点, 关于支持向量机的模式识别在20世纪90年代中期提出后就得到了大量的专家和学者的重视, 并得到了较为广泛的认知和应用[5]。支持向量机识别解决了函数估计和模式识别等问题。在数字图像处理中具有寻找图像像素的特征, 可根据像素点的特征和周围的环境检测出其差异, 并具备各像素点区分功能。

3 结语

随着科技的进步和信息技术的发展, 利用计算机技术对文字进行识别的应用越来越广泛, 该文通过模式识别技术的几种应用方法进行了简单分析, 对其在统计识别、模糊识别、神经网络识别、句法结构识别、支持向量机的模式识别的应用上加以总结和归纳, 从中了解到模式识别技术还具有巨大的发展空间, 通过人们的不断研究, 模式识别技术不仅能够更好的应用到文字识别中, 同时还能够广泛的应用到其它领域中。

参考文献

[1]张俊玲, 赵林.模式识别的方法与应用[J].产业与科技论坛, 2014 (13) :131-132.

[2]高翔, 邢玉娟.模式识别及其在图像处理中的应用[J].自动化与仪器仪表, 2015 (3) :102-103.

[3]罗笑玲, 黄绍锋, 欧阳天优, 等.基于多分类器集成的图像文字识别技术及其应用研究[J].软件, 2015, 36 (3) :98-102.

[4]崔志国, 曾丽娟, 李晓静.创新技术与应用模式提升勘验系统应用效率[J].警察技术, 2011 (2) :26-28.

基于仿射变换的文字识别方法 篇4

关键词:近似圆,正规化,特征直方图,文字识别

近年来, 随着数码相机制造技术的日益成熟, 数码相机的性能大幅提高, 千万级像素的数码相机已经成为主流配置, 市场上也已出现了为手机配置的千万级像素微型数码相机。数码相机的性能除了硬件的提升, 在软件方面, 自动拼接、防抖、人脸识别等功能的实现使得用户能够轻松拍到清晰、专业的数字图像。在此背景下, 数字图像中的文字识别技术受到了广泛的关注。围绕图像中的文字识别技术, 研究人员在自然场景理解、汽车牌照识别、数字图像图书馆、地理信息系统等领域展开了相关的研究与应用[1], 也出现了诸多成熟的商用软件。

然而, 在对数字图像中的文字进行识别的过程中, 存在着许多必须解决的问题[2]。其中, 拍摄图片时由相机与文字平面存在的角度与透视关系而造成的文字变形是妨碍文字识别的主要原因。本文提出了利用仿射不变性对变形文字进行矫正, 通过比较校正后距离直方图及角度直方图与标准样本的相似度, 进而进行高速文字识别的方法。仿射不变性对沿x, y轴旋转的变形文字具有良好的矫正效果, 同时, 通过比对角度直方图的方法, 使得沿z轴方向的旋转文字也能够高速有效地识别。因此, 本文所提方法对沿各方向旋转的变形文字均能保证具有较高的正确识别率。

1 基于仿射不变性的文字识别方法

1.1 基于仿射变换的文字标准化处理。

本方法首先对产生变形的待识别文字做近似椭圆, 后将近似椭圆矫正为标准正圆。因变形文字与近似椭圆具有相同的仿射性质, 近似椭圆矫正为正圆的同时, 变形文字也矫正为标准化文字。

1.2 依据距离直方图的初步文字识别。

文字图像中到文字重心距离相等的文字像素的分布情况称为距离直方图。经仿射变换后的正圆半径为R, 设圆内bin数为n, 总bin数为k。在本方法中n与k有如下关系:

即将正圆半径R平均分成n份, 相邻两个同心圆的半径差为R/n。因标准化处理后的正圆外仍有可能存在文字像素, 故依据k的取值, 将正圆外按照半径差为R/n的规律添加1或2个同心圆。统计落在相邻两个同心圆间的文字像素个数, 即可做成该文字的距离直方图。将距离直方图的bin总数调整为1, 进而能够得到归一化的距离直方图。将归一化的距离直方图视为一个k维向量, 每个bin内的文字像素个数视为向量值, 则利用式1可计算待识别文字与标准样本文字的相似度。

其中, X为标准样本文字的直方图, Y为待识别文字的距离直方图。当计算得到的相关系数ρ>Td时, 则输出识别结果。若比对所有标准样本文字后得到的相似系数ρ均小于阈值Td时, 则依据角度直方图进行进一步的识别判断。

1.3 依据角度直方图的文字识别。

文字像素在各角度内的分布情况称角度直方图。将标准化处理后的图像按角度平均分成m份, 统计在每个扇形区域内的文字像素个数, 即可做成该文字的角度直方图。将角度直方图的bin总数调整为1, 亦可得到归一化的角度直方图。

传统的旋转文字识别方法, 需要从不同方向统计直方图, 比较与标准文字直方图的相似性后, 进而进行文字的识别。此方法每次变换方向都需要重新统计文字像素的个数, 因此必然会破坏文字识别的实时性。利用角度直方图的文字识别方法, 统计以文字重心为圆心, 向外辐射的扇形区域内的文字像素量, 因此具有旋转不变性。当与标准文字直方图进行比较时, 无需重新统计分布直方图, 只要进行移位处理即可完成旋转文字的直方图统计, 因此可有效缩短文字识别时间, 提高实时性。

同样, 计算待比较文字旋转m次与标准样本的相似度ρ, 当ρ>阈值Ta时, 输出识别结果。若比对所有标准样本文字后得到的相似系数ρ均小于阈值Ta时, 则进入综合识别判断阶段。

2 仿真实验及结果分析

本实验所用计算机的处理器为Intel CeleronⅢ, 主频为1.0GHz, 内存为512M。为模拟手机、数码相机等嵌入式设备的处理能力, 本实验特选取了配置相对较低的计算机进行模拟仿真实验。实验对象为Times New Roman字体的10个数字及52个英文大小写字母, 共计62个字符。利用仿射变换矩阵 对62个字符实施仿射变换。在此将仿射变换矩阵做如式1分解:

其中L (β) 为放大缩小变换矩阵, 参数β为放大缩小倍数。R (θ) 为旋转变换矩阵, 参数θ为旋转角度。S (φ) 为偏移变换矩阵, 参数φ为水平偏移角度。分别设置参数β、θ及φ的值, 并对62个英文字符进行仿射变换。

利用基于仿射不变性文字识别的方法, 对前述变换后的变形文字进行识别, 其正确识别率及识别时间如表1所示。由于篇幅所限, 本文并未将所有的实验结果列入表中, 只将部分有代表性的结果罗列出来。由表1可见, 在对表中所列出的22个字符所进行的识别实验中, 平均正确识别率达到了97.4%, 最高识别率为100%, 最低识别率为50.1%。对所有62个字符的实验结果而言, 90%以上的字符其正确识别率超过了98%。从文字识别所用时间上看, 本方法的文字识别时间主要分为四部分:变形文字标准化所需时间;依据距离直方图的初步识别时间;依据角度直方图的识别时间及综合识别时间。实验结果表明四部分的平均耗时分别为:30ms, 50ms, 90ms, 10ms。因此, 利用本方法进行文字识别的最短时间约为80ms, 最长时间约为180ms。与传统的识别方法相比, 在旋转文字的识别阶段最多可节约400ms的时间, 大大提高了文字识别速度, 满足了文字识别在嵌入式系统中应用的实时性需求。

3 结论

本文提出了基于仿射不变性的高速文字识别方法。仿真数据的实验结果表明除少数形近字外, 此方法对90%以上的英文及数字有100%的正确识别率。且基于角度直方图的旋转文字识别方法使得旋转文字的识别速度与传统方法相比提高了60%以上。证明了本文所提方法在文字识别领域中的有效性及其高效性。

参考文献

[1]李敏花, 柏猛.基于蚁群优化算法的复杂背景图像文字检测方法[J].计算机应用, 2011 (7) :1844.

文字排版技术的初步图像分析 篇5

当今世界, 越来越多的年轻人已经成为“低头族”之列, 即从手机或i Pad等移动电子设备上获取信息或者阅读。这标志着一种全新的阅读模式正在被很多人选用, 这就是电子阅读。与传统的书籍、报纸等纸质阅读相比, 电子阅读具有很多突出的优点:第一, 容量大。第二, 携带方便。第三, 阅读方便。一般书本的宽度远远大于手机等电子阅读设备的屏幕宽度, 如果将书本上的每一页内容按比例直接显示到屏幕上, 则会出现字体太小、不清晰, 或者需要通过不停的缩放来阅读, 严重影响了阅读效果。如何获得最佳阅读效果, 是电子出版业的当务之急。基于图像分析的文字排版技术很好的解决的这些问题, 是的电子阅读也能取得纸质阅读的效果。

1 文字图像的获取

文字图像的获取过程很简单, 在计算机上打开书本的电子文档, 选择所需要的文字区域的图像, 可以通过截屏或快照等方式保存下来, 以备后续处理适用。在理论上, 阅读者在源图像选择时, 可以选择出一片只包含自己所需文字内容的区域。但在实际操作过程中很难做到, 总会或多或少地在文本四周留下空白区域, 如图1所示。这些空白区域对文字的重新排版的最终效果影响很大。由于计算机图像分辨率高, 图像宽度远远大于手机等移动阅读设备, 如果不能有效清除空白区域, 则可能出现页面过小或者页面某一侧文字内容显示不全的不良阅读效果。因此, 必须把空白区域清除掉。除了一般的图像信息需要重排以外, 还有一些文本累的附加信息也需要重排, 例如PDF、word等文档里文字都具有一定的格式, 有时还有附注等。如果将文本信息直接存储到阅读设备上, 会造成一些重要附加信息的漏失或丢失, 给客户的阅读理解造成极大的影响。因此, 也需要进行文字重排。基于图像分析的文字排版技术可以很好的解决问题。

2 基于图像初步分析的文字重排版技术

基于图像初步分析的文字重排可以通过三步实现, 即源图像分析、文字分割和重新排版。

2.1 源图像分析

源图像分析主要是为了获得图像的四个关键的参数值:左侧宽度Wl、右侧宽度Wr、上侧高度Ht以及下侧高度Hb。用户可以通过像素统计方法获取相关参数, 即通过对除去空白的源图像进行扫描, 从一个方向向另一个方向扫描每一个像素, 并对垂直方向的像素值进行统计, 记录像素值。最后对像素值进行处理, 为文字分割和重排做好准备。

2.2 文字分割

要实现图像文字的重排, 就必须对源图像文字进行合理的分割。根据扫描结果计算出每一行文字的宽度, 再结合移动阅读设备的屏幕像素进行分割。处理过程:第一步, 按照目标阅读设备的屏幕分辨率设置目标图像的高度H和宽度W;第二步, 设置文字排版后放置的起始位置变量P1;第三步, 利用自动程序将源图像中的每行文字进行图像信息赋值, 并利用变量转换找到每行换行处的变量Pn, 即分割点位置。分割完以后, 把目标图像保存到内存磁盘中。

2.3 文字重排

将每一行的源图像文字进行分割以后, 将相邻两个分割点间的文字放到同一行, 进行文字重排。p1与p2之间的文字为第一行, p2与p3之间为第二行, 一次类推, 得到重排后的版式效果, 如图3。重排后, 阅读效果良好。

3 结论

正当电子阅读以极快的普及速度冲击广大阅读爱好者阅读习惯的时候, 文字重新排版成了急需解决的问题。基于图像分析的文字排版技术很好的解决的这个问题, 并使电子阅读也能取得纸质阅读的效果。同时, 通过该技术在文字内容上打上版权水印, 能够有效解决盗版问题, 使得电子出版业侵权、盗版等版权现象也得到很好的缓解, 起到了维护版权的目的。

参考文献

[1]邓连瑾, 尤德祥, 李瑞.基于图像分析的文字排版技术的深入研究[J].科学时代, 2013 (3) :5-8.

图像识别技术研究综述 篇6

关键词:图像处理,图像识别,成像

图像是客观景物在人脑中形成的影像,是人类最重要的信息源,它是通过各种观测系统从客观世界中获得,具有直观性和易理解性。随着计算机技术、多媒体技术、人工智能技术的迅速发展,图像处理技术的应用也越来越广泛,并在科学研究、教育管理、医疗卫生、军事等领域已取得的一定的成绩。图像处理正显著地改变着人们的生活方式和生产手段,比如人们可以借助于图像处理技术欣赏月球的景色、交通管理中的车牌照识别系统、机器人领域中的计算机视觉等,在这些应用中,都离不开图像处理和识别技术。图像处理是指用计算机对图像进行处理,着重强调图像与图像之间进行的交换,主要目标是对图像进行加工以改善图像的视觉效果并为后期的图像识别大基础[1]。图像识别是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。但是由于获取的图像本事具有复杂性和特殊性,使得图像处理和识别技术成为研究热点。

图像处理(image processing)利用计算机对图像进行分析,以达到所需的结果。图像处理可分为模拟图像处理和数字图像图像处理,而图像处理一般指数字图像处理。这种处理大多数是依赖于软件实现的。其目的是去除干扰、噪声,将原始图像编程适于计算机进行特征提取的形式,主要包括图像采样、图像增强、图像复原、图像编码与压缩和图像分割。

1)图像采集,图像采集是数字图像数据提取的主要方式。数字图像主要借助于数字摄像机、扫描仪、数码相机等设备经过采样数字化得到的图像,也包括一些动态图像,并可以将其转为数字图像,和文字、图形、声音一起存储在计算机内,显示在计算机的屏幕上。图像的提取是将一个图像变换为适合计算机处理的形式的第一步。

2)图像增强,图像在成像、采集、传输、复制等过程中图像的质量或多或少会造成一定的退化,数字化后的图像视觉效果不是十分满意。为了突出图像中感兴趣的部分,使图像的主体结构更加明确,必须对图像进行改善,即图像增强。通过图像增强,以减少图像中的图像的噪声,改变原来图像的亮度、色彩分布、对比度等参数。图像增强提高了图像的清晰度、图像的质量,使图像中的物体的轮廓更加清晰,细节更加明显。图像增强不考虑图像降质的原因,增强后的图像更加赏欣悦目,为后期的图像分析和图像理解奠定基础。

3)图像复原,图像复原也称图像恢复,由于在获取图像时环境噪声的影响、运动造成的图像模糊、光线的强弱等原因使得图像模糊,为了提取比较清晰的图像需要对图像进行恢复,图像恢复主要采用滤波方法,从降质的图像恢复原始图。图像复原的另一种特殊技术是图像重建,该技术是从物体横剖面的一组投影数据建立图像。

4)图像编码与压缩,数字图像的显著特点是数据量庞大,需要占用相当大的存储空间。但基于计算机的网络带宽和的大容量存储器无法进行数据图像的处理、存储、传输。为了能快速方便地在网络环境下传输图像或视频,那么必须对图像进行编码和压缩。目前,图像压缩编码已形成国际标准,如比较著名的静态图像压缩标准JPEG,该标准主要针对图像的分辨率、彩色图像和灰度图像,适用于网络传输的数码相片、彩色照片等方面。由于视频可以被看作是一幅幅不同的但有紧密相关的静态图像的时间序列,因此动态视频的单帧图像压缩可以应用静态图像的压缩标准。图像编码压缩技术可以减少图像的冗余数据量和存储器容量、提高图像传输速度、缩短处理时间。

5)图像分割技术,图像分割是把图像分成一些互不重叠而又具有各自特征的子区域,每一区域是像素的一个连续集,这里的特性可以是图像的颜色、形状、灰度和纹理等。图像分割根据目标与背景的先验知识将图像表示为物理上有意义的连通区域的集合。即对图像中的目标、背景进行标记、定位,然后把目标从背景中分离出来。目前,图像分割的方法主要有基于区域特征的分割方法、基于相关匹配的分割方法和基于边界特征的分割方法[2]。由于采集图像时会受到各种条件的影响会是图像变的模糊、噪声干扰,使得图像分割是会遇到困难。在实际的图像中需根据景物条件的不同选择适合的图像分割方法。图像分割为进一步的图像识别、分析和理解奠定了基础。

2 图像识别技术

图像识别是通过存储的信息(记忆中存储的信息)与当前的信息(当时进入感官的信息)进行比较实现对图像的识别[3]。前提是图像描述,描述是用数字或者符号表示图像或景物中各个目标的相关特征,甚至目标之间的关系,最终得到的是目标特征以及它们之间的关系的抽象表达。图像识别技术对图像中个性特征进行提取时,可以采用模板匹配模型。在某些具体的应用中,图像识别除了要给出被识别对象是什么物体外,还需要给出物体所处的位置和姿态以引导计算初工作。目前,图像识别技术已广泛应用于多个领域,如生物医学、卫星遥感、机器人视觉、货物检测、目标跟踪、自主车导航、公安、银行、交通、军事、电子商务和多媒体网络通信等。主要识别技术有:

2.1 指纹识别

指纹识别是生物识别技术中一种最实用、最可靠和价格便宜的识别手段,主要应用于身份验证。指纹识别是生物特征的一个部分,它具有不变性:一个人的指纹是终身不变的;唯一性:几乎没有两个完全相同的指纹[3]。一个指纹识别系统主要由指纹取像、预处理与特征提取、比对、数据库管理组成。目前,指纹识别技术与我们的现实生活紧密相关,如信用卡、医疗卡、考勤卡、储蓄卡、驾驶证、准考证等。

2.2 人脸识别

目前大多数人脸识别系统使用可见光或红外图像进行人脸识别,可见光图像识别性能很容易受到光照变化的影响。在户外光照条件不均匀的情况下,其正确识别率会大大降低。而红外图像进行人脸识别时可以克服昏暗光照条件变化影响,但由于红外线不能穿透玻璃,如果待识别的对象戴有眼镜,那么在图像识别时,眼部信息全部丢失,将严重影响人脸识别的性能[4]。

2.3 文字识别

文字识别是将模式识别、文字处理、人工智能集与一体的新技术,可以自动地把文字和其他信息分离出来,通过智能识别后输入计算机,用于代替人工的输入。文字识别技术可以将纸质的文档转换为电子文档,如银行票据、文稿、各类公式和符号等自动录入,可以提供文字的处理效率,有助于查询、修改、保存和传播。文字识别方法主要有结构统计模式识别、结构模式识别和人工神经网络[5]。由于文字的数量庞大、结构复杂、字体字形变化多样,使得文字识别技术的研究遇到一定的阻碍。

3 结束语

人类在识别现实世界中的各种事物或复杂的环境是一件轻而易举的事,但对于计算机来讲进行复杂的图像识别是非常困难的[6]。在环境较为简单的情况下,图像识别技术取得了一定的成功,但在复杂的环境下,仍面临着许多问题:如在图像识别过程中的图像分割算法之间的性能优越性比较没有特定的标准,以及算法本身存在一定的局限性,这使得图像识别的最终结果不十分精确等。

参考文献

[1]胡爱明,周孝宽.车牌图像的快速匹配识别方法[J].计算机工程与应用,2003,39(7):90—91.

[2]胡学龙.数字图像处理[M].北京:电子工业出版社,2011.

[3]范立南,韩晓微,张广渊.图像处理与模式识别[M].北京:科学出版社,2007.

[4]晓慧,刘志镜.基于脸部和步态特征融合的身份识别[J].计算机应用,2009,1(29):8.

[5]陈良育,曾振柄,张问银.基于图形理解的汉子构型自动分析系统[J].计算机应用,2005,25(7):1629-1631.

小波分析在文字识别中的应用 篇7

关键词:小波分析,文字识别,应用,发展

小波分析属于调和分析方式, 能够有效解决数学分析方式, 推动社会各行业中数学模型的构建和运算。在社会发展的各个行业中, 文字和图像信号的信息资料的收集和分析成为影响行业发展的重要因素。而小波分析能够有效处理、分析非稳定的文字和图像等信号问题。同传统的数学三角函数计算方式对比, 小波分析能够充分掌握时间和空间频率上的相关信号, 从中提取科学、准确的信息。因而通过探究小波分析在文字识别信号上的应用, 深入探究小波分析在图像、音频等非稳定信号上的应用, 能够最终实现多个变量研究信号, 提高对信号中的有用信息的提取和应用的效果。

1 小波分析的发展研究

1.1 小波分析的发展流程

小波分析基于伸缩和平移方法的相关思想, 并随着计算机二进制算法的发展, 构建成多尺度分析思想, 对信号进行时频化研究。随着数学学科的发展, 相关学者提出了多分辨分析的概念, 依托此概念建立的快速小波算法, 推动小波分析从理论研究走向实践应用。1992年, 快速小波算法提出了小波包的概念计算法, 构成了更为精细和个性化的分析计算方式。总之, 小波分析理论从构建到不断完善, 从理论成果到实际应用经历了较长的历程, 因而目前在应用领域中更具实用的价值。与此同时, 小波分析的相关研究仍存在较大的空间, 特别是各种小波构造和性质, 在未来的发展中, 小波分析将会系统化应用到具有前景的领域中[1]。

1.2 小波分析应用的工作领域

小波分析理论正朝着可科学化、系统化的方向发展, 当前小波分析不仅在文字识别方面具有重要的应用, 同时在以下几个方面也发挥重要的作用, 实现小波应用研究工作的主要方面的分析, 对于统筹兼顾文字识别方面的小波分析理论具有重要的推动作用。

第一, 小波分析在数学领域中的应用。主要有微分方程、积分方程、函数逼近和概率小波、非线性分析等, 提高了数学领域中计算分析的准确性和效率性。第二, 小波分析在信号处理的应用。这一领域主要是本文研究的重点, 即关于信号识别、信号检测和去噪等的应用。包括语音信号、医学信号、自然信号、天文信号等。第三, 小波分析在图像处理中的应用。当前小波分析在图像处理领域中包括对交互图像的分析、图像中文字水印处理、模式识别等具体项目。通常情况下同信号处理领域具有一致性。第四, 小波分析在通信系统中的应用。通信领域成为当前重要的发展领域, 小波分析能够推动扩频通信、自适应均衡等的创新提高。第五, 小波分析在其他领域中的应用。小波分析不仅在生活生产活动中具有重要的应用性能, 同时在人类发展中也同样具有广泛的应用能力。同时国内外还构建了专门的小波分析研究的课题、小组和网站, 为小波分析的创新和应用提供了丰富的载体和机遇。

2 小波分析的特点和文字识别相关知识

2.1 小波分析的特点

小波分析理论在数学和工程领域引起了重大的反响。因而其基本理论在不断巩固和成熟。通过小波分析理论的发展历程可知, 小波分析在文字识别中具有以下应用特点[2]:

第一, 小波分析的正交性特点。小波分析的正交性是研究小波的重要切入点, 同时小波分析的正交性同低通滤波器和高通滤波器系数之间具有密不可分的联系。因而正交小波的构造对于小波分析在各个领域中的应用具有重要的奠定作用。另外, 在征收小波分析的正交性特点的基础上, 可以设计出具体的分解滤波器和综合滤波器的长度, 提高分解的速度和提高重构的精确度。

第二, 小波分析的对称性特点。人类的视觉系统对于信号的接收不敏锐, 同时忽略边缘的对称性量化误差的接收。因而在图像处理领域中, 图像边缘的扩展会导致在重构图像时边缘部位失真较大, 不利于复杂特性的分析。而小波分析的对称性, 则可以给出相关的线性相位的定义和对称关系, 有效避免信号在分析和重构中的失真问题[3]。

2.2 文字识别相关知识

随着计算机技术的深入发展, 文字识别成为当前行业发展重要的项目。当前文字识别的工作主要是将文字输入到计算机中, 提高文字使用和储存的效率。在文字识别中主要包括文字信息处理、办公自动化处理、邮件分类处理和智能翻译等领域, 对于社会大多数行业的文字工作都具有重要的理论和实际意义。与此同时, 文字识别还包括对图像等的识别和应用领域中。

计算机分析理论进行文字识别时, 必须基于文字进行预处理, 实现位置、大小、笔画粗细等的一致性处理的前提下, 展开相关系统的识别功能。主要的文字识别的工序为:信息获取、预处理、特征提取与选择、识别这4个工序。最重要的工序是特征提取和选择。在文字识别中, 特征提取和选择主要是通过选取一个相关的模式, 进行文字和图像等信息的收集, 按照模式的要求对收集到的文字和图像信息数据进行再甄选、压缩或变换处理, 尽可能地获取到能反映出信息本质的数据信息, 从而有效地分类和描述。这一工序是文字识别系统中的关键部位。小波分析应用的重要环节即在于对测量和收集所获得的数据发挥作用。当前测量后的数据将会组成一个测量空间, 获取的信息特征数据会构成特征空间, 最终形成一个具有多维特点的空间向量[4]。

3 小波分析在文字识别中的理论应用

本文主要探究小波分析在文字识别中的特征提取问题上的具体应用情况。通过上文小波分析理论等的探究可以发现, 在特征提取问题中, 小波分析主要使用了小波分解和分形维的相关概念[5]。

3.1 小波分解在文字识别中的应用

利用小波分解法获取文字的最基本结构, 如“横、竖”等数据, 同时获得文字的笔画数量和起始向量。但中国汉字具有同形、同音等特点, 导致分解识别的效率不高。如“大、太、犬”等字的起始向量和笔画结构等具有一致性, 同时也会存在同一个字被归类到2个不同特征空间中的问题。总之, 小波分解在文字分类中面临较大的细节挑战。但总体上, 小波分解有效地解决了文字分解后的空间级别问题。小波分解在文字识别中的算法使用具体如下。通过生成正交多分辨分析算法, 实现文字的特征选取函数和文字信息重构函数之间的算法连接, 从而实现提取母小波函数的选取, 根据本文的相关数据, 该函数关系主要如图1所示[6]。

3.2 分形维在文字识别中的应用

分形维是一种空间维数, 主要反映了该复杂几何点集的复杂情况, 区别于一般的数学函数, 主要有迭代函数系统表示, 只能通过计算机来显示具体形态, 同直线、矩形等一般几何元素不具有直接关系。同时计算得出的分形维能够作为特征向量, 投入到文字识别中。分形维主要基于小波分解, 寻找出反映相似字形之间差异的特征向量, 有效区别待识别的字体, 通过多分辨分析信号, 计算得出各级别的分形维, 有效区分各级别分形维的差异性和相关性。因此, 该分形维在实际应用中有利于统一特征向量的各个维数, 实现文字识别特征提取工序的统一性特点。

总之, 小波分析在文字识别中的应用主要包括:第一, 在计算机中输入识别文字的相关信号;第二, 使用小波分解对原始信号进行分解计算, 得到相关的笔画和起始向量, 在此基础上, 得出原始信号的各级子模式;第三, 得出各级子模式的分形维, 作为特征向量;第四, 在特征空间中, 运用特征向量同数据库中的向量对比、分析;第五, 最终得出文字识别的结果[7]。

4 结语

综上所述, 本文在对小波分析在文字识别中应用研究中, 缺少对识别实验的分析, 因而在应用上仍处于理论应用, 在未来的分析中, 要通过具体的文字识别或图像识别的案例构建小波分析方法的识别系统。但本文在理论研究中, 系统地解释了小波分析的相关理论发展、文字识别的相关算法运用, 有效地总结了小波分析法在文字识别中可能运用到的相关技术理论, 如小波分解、分形维构建等。从理论研究中可以发现, 在文字识别的特征提取环境中, 小波分析能够有效地构建特征向量, 减少特征向量的维数, 从而减少识别误差, 增加文字识别的准确率。而且基于小波分析的文字识别能够有效排除文字变形、旋转等造成的难题, 对英文字母等也具有较高的识别能力。因此, 要充分发挥小波分析在文字识别中的计算能力, 提高识别的有效性。

参考文献

[1]桑燕芳, 王中根, 刘昌明.小波分析方法在水文学研究中的应用现状及展望[J].地理科学进展, 2013 (9) :1413-1422.

[2]李继军.小波分析及其在信号、图像降噪中的应用研究[D].西安:西安电子科技大学, 2015.

[3]翟彦.小波分析理论在信号处理中的研究及应用[D].昆明:昆明理工大学, 2010.

[4]耿万海.小波分析在求解奇异积分与分数阶微分方程中的应用[D].秦皇岛:燕山大学, 2012.

[5]黄丽莉, 李晓燕.小波变换在文字识别中的应用[J].新乡学院学报, 2014 (2) :21-24.

[6]李雷.基于人工智能机器学习的文字识别方法研究[D].成都:电子科技大学, 2013.

上一篇:7-11连锁店论文下一篇:脑发育不良