文字识别:在线OCR识别更轻松!

2024-05-14

文字识别:在线OCR识别更轻松!(精选2篇)

文字识别:在线OCR识别更轻松! 篇1

大家平常扫描识别一些文字资料的时候,通常会用到OCR文字识别软件,不过有时候手头没有这类软件或者懒得安装,这就需要笔者推荐的在线OCR网站来帮忙了,在线OCR识别网站(www.netocr.net)应用了清华大学研制的国际领先OCR识别技术,支持TIF、BMP、JPG等多种常见图像格式,能识别出纯英文、简繁体中文、日文、韩文以及手写体和中英文混排的文本图像。通过它,可以从此告别OCR软件,随时随地轻松搞定文字识别。

一、注册会员

要使用该网站提供的服务,我们需要先注册。点击首页上十分显眼的“注册”按钮,进入注册页面,填入各项相关内容即可。此处要注意的是,在“邮箱”一栏中,请务必填入正确的电子信箱地址,以便网站将识别结果发送到你的信箱。注册完成后,输入用户名、密码,登录至用户文件管理页面(图1),在这里进行图像的在线OCR操作。

图1

二、上传图像

在本地硬盘上准备好需要OCR的图片文件,单击管理页面中的“识别”按钮,进入如(图2)所示的“上传识别”页面,在此点击“浏览”按钮,选择硬盘中欲识别的图像文件,而后依次选择好需要识别的文件语言、输出文字的格式、识别要求等基本选项。如果勾选“显示其他选项”,还可进行识别方式、设置内码类型、导出格式、发送识别文件至用户信箱等更多方面的设置,可按各人实际需求选取。最后单击“上传识别”按钮,即开始OCR识别工作,

图2

提示:为了取得较为理想的识别效果,用户上传的图像最好为TIF格式,分辨率越高识别效果越好,不过图像文件变大会导致上传速度变慢。注册用户可以免费在线识别999幅图像,但一天之内不超过99幅图像,且提交的识别图像总空间也不能超过50MB。

点击阅读更多学院相关文章>>

分享到 三、输出结果

从图像中识别出文本字符,由于图片大小、网络速度等客观因素的存在,因此识别需要一段时间,当识别工作完成后,识别出来的文字会显示在“识别结果”文本框中(图3)。

此时文本框中的文字已经变成了纯文本文字,你可以将文本复制、粘贴到Word或WPS等文字处理软件中进行编辑。如果你先前选中了“显示其他选项”,此时还可选择将文字以RTF、HTML、PDF三种文件格式导出,或者将识别结果发送至自己的邮箱。

提示;现在不少网站都加强了网页的保护,不允许保存网页或者在文字中夹杂了无关内容,通过在线OCR,我们可以将这些网页抓图再识别,这样再高明的网页保护也不攻自破了。

上一页 1 2

点击阅读更多学院相关文章>>

分享到

文字识别:在线OCR识别更轻松! 篇2

ABBYE FineReader的主要功能及特点

ABBYY FineReader是俄罗斯ABBYY公司研制成功的一款真正的专业OCR的软件!OCR (Optical Character Recognition, 光学字符识别) 技术, 是指电子设备 (如扫描仪或数码相机) 检查纸上打印的字符, 通过检测暗、亮的模式确定其形状, 然后用字符识别法将形状翻译成计算机文字的过程。

安装并打开软件 (官方下载地址:http://www.abbyy.cn/) , 启动后显示任务窗口, 在窗口的右上角选择文档语言, 这里选择了简体中文。在任务窗口中有几个常用任务选项, 包括Word、PDF、电子书和其他格式等文件操作 (如图1) 。

界面很简洁, 菜单类似于普通的Windows菜单, 如有“文件”、“编辑”等菜单命令, 即使是新手, 也能不费吹灰之力就使用该软件。

ABBYY FineReader的主要功能和特点为:①把静态纸文件和PDF文件转换成可管理的电子数据;②重建原生的多页文件格式;③支持轻松创建最流行格式的电子图书;④可以提供直观的工具扫描文件, 并随时转换图像扫描、照片成为可编辑和可搜索的电子格式的PDF文件;⑤多国语言可以选择, 能转换几乎所有打印的文档类型, 包括书籍、杂志上的文章与复杂的布局、表格和电子表格, 甚至能以准确的精度发传真。

ABBYY FineReader在教学中的应用

下面以把PDF中的文字转换成Word中的文字为例, 来说说ABBYY FineReader软件的具体应用。

1.打开PDF文件并设置参数

进入ABBYY FineReader软件, 选择任务后会自动进入下一个界面, 此时会自动弹出让使用者选择文件, 如果没有选择文件, 则可以在菜单栏中点击“打开”, 然后选择需要转换的文件, 注意在文件类型中选择相应的类型, 这里应该选择PDF, 默认的是图形文件, 不更改的话最后得到的是乱码。

打开后可进行基本设置。在菜单栏中选择“工具”中的“选项”, 弹出如图2的窗口。选项设置窗口中可以设置要保存的格式, 里面有10种可选的格式, 这里我们转成的是DOC或者DOCX, 所以选择第一个。窗口里面还有读取模式等多项设置, 这里就不再一一列举了。

2.文字识别

在所打开的PDF文件中, 选择要转换的页面, 当然也可以对全部页面或页面的部分内容进行转换。这里有两个窗口, 一个是转换前的PDF图像页面, 另一个是转换后的文本页面。单击PDF图像页面窗口的“读取”选项, 进行OCR识别, 就是让软件把图片中的文字读取出来 (图片中文字越多, 识别花费的时间越长) , 完成识别之后, 就会在文本页面出现所转换的文本。其中的一些文字带有青色背景底色, 这说明这些文字是有可能出现错误的, 我们要对它们进行修正 (如图3) 。

3.文字修正

一般来讲, 图片越清晰、对比越鲜明的时候, 该软件对文字的识别率就越高。识别率与图片清晰度、文字大小、文字的端正程度、文字与底色的对比程度有关。ABBYY FineReader的识别率在所有OCR软件中是最好的, 基本能在95%以上, 当然不能保证100%。为保险起见, 还是要人工核对一下识别的结果, 尤其是格式特别复杂、有特殊文字和符号的地方很容易出错。当然如果使用者用肉眼都看不清楚或者不能分辨的文字, 那该软件识别出来的可能性是不大的。

该软件的原理是使用扫描的文本字符与系统内置的字符形状、语言辞典进行比较, 从而识别文字, 只能扫描指定的语言, 其他语言不能识别。所以如果错误率太高, 则要更改使用的扫描语言。

单击文本页面窗口的“验证”选项, 此时会弹出验证窗口 (如图4) 。在这个窗口中会有一些带有青色背景底色的不确定文字或字符, 如果错误的话我们可以直接修改, 若是正确则可点击“忽略”跳过。

完成修正后就可以保存所转换的文本了, 有包括DOC/DOCX在内的10多种保存格式可以选择, 一般选择为Word97-2003格式或DOCX格式, 完成后就能在Word中进行文本编辑了。对于提取JPG、BMP等格式图片中的文字的方法与PDF格式操作大同小异, 这里就不再说明。

另外, 值得一提的是, 如果图片较为模糊或摆放不正, 会影响软件对图片文字的读取效果, 此时使用者就需要用到工具栏中的“编辑图像”进行图像校正。点击“编辑图像”就会弹出图像编辑窗口 (如图5) 。使用者可以看到右侧有一排工具, 用这些工具可以对图像的歪斜校正等多种参数进行编辑修正处理, 这样会大大提高图片的识别率。

【文字识别:在线OCR识别更轻松!】推荐阅读:

手写文字识别06-03

图像文字识别论文07-03

车牌识别07-16

语音识别10-15

识别性能10-17

轮廓识别05-08

识别标志05-11

面孔识别05-11

物种识别05-11

种属识别05-15

上一篇:敬老主题班会课件下一篇:越努力越幸运初三优秀作文