有道云笔记上线OCR功能:轻松识别图片/PDF中文字(支持汉字)

2017-5-17 17:31:28   IT之家(远洋)

IT之家5月17日消息,继上线语音速记功能后,网易旗下产品有道云笔记又上线了另一实用的功能——文档OCR(即文字识别)。据悉,新上线的OCR功能在原有的扫描功能进行了升级,能够帮助用户轻松识别图片、PDF等扫描文档中的文字,并将其转化成可编辑的文档。

如果你还不了解新功能OCR究竟能为你做什么,那你一定遇到过以下这些情况,而OCR功能就是对这些“症结”的那款“灵丹妙药”:

· 工作或者科研学习中,要应对大量的纸质文件、书刊杂志、PDF格式的电子资料,很难对这些格式的资料进行编辑和整理

· 读书时,看到不错的文章段落想要做书摘笔记,但又懒得去打字或是手抄整理

· 在微信、微博等内容平台看到有价值的图片内容会随手保存mark,或是用截屏把手机页面内容保存到相册,但这些图片信息散乱在手机各处,很难进行归纳、整理和检索

以上难题,只需要5秒就能搞定!

那么,如何用OCR识别功能将纸质资料、图片和PDF文件,转换为可以自由编辑的文本格式呢?

「纸质文档」OCR识别

把纸书、合同等纸质文件、甚至墙体海报,转换成可编辑的文本格式,只需三步:

step1:智能扫描

将有道云笔记升级为最新版后,点击加号按钮,新建一篇“文档扫描”。

接下来就是见证实力的时刻,扫描过程中无需任何人工操作,软件可以自动、精准识别扫描图像的边框,去除扫描区域以外的多余背景,并且矫正偏斜,稳!准!狠!地将资料扫描进来。

如果对自动扫描结果不够满意,还可以选择手动调节模式进行微调。

在扫描过程中,请尽量将文字摆正,尽量剔除图片中无关的部分,这样可以大大提高文字识别的准确度啊~

step2:扫描图片滤镜美化

扫描后的图片会自动调节亮度和对比度,可以便捷的设置为增强或黑白模式,让图片更清晰。

step3:OCR识别,提取图片内文字

在进行OCR之前,请先将扫描文档进行同步保存。选择需要进行文字识别的图片后,点击底部的“识别”按钮,就能将这张扫描图片内的文字识别出来并转换成一篇文字笔记。

识别出的文本会直接保存到有道云笔记内,多平台同步,你可以在手机版、PC端、网页端等任意平台的有道云笔记内进行修改、编辑、整理。

在扫描图片足够清晰的情况下,文本识别的准确率可以达到95%以上。

原图片

识别文字

「图片」OCR识别

如何将那些“锁在”图片里的文字提取出来?我们用一张hin长(包含了2000多字内容)的微博长图来为大家演示图片OCR的用法和文字识别效果。

首先,进入有道云笔记,选择“上传图片”,将要识别处理的图片同步保存到有道云笔记。

然后,在页面底部找到“更多”按钮,点击“文本识别OCR”,就可以看到长图内的文字被完美识别出来了!

虽然网络图片的分辨率不是很高,并且单张图片文字内容较多,但是文字识别效果一点不含糊。

图片 ←→ 识别文本

「PDF文档」OCR识别

除扫描文档、图片外,有道云笔记(限会员)还可以PDF文本识别服务,PDF轻松转Word!

将PDF文档上传到有道云笔记,并完成同步后,点击底部的“OCR”按钮,经过几秒的等待后(视PDF文档大小而定),就可以看到PDF内的文字被识别出来,轻松转化为可以自由编辑的笔记格式。

PDF文档

识别文本

目前双栏布局PDF文档的文本识别支持度较差,暂时建议选择一栏布局的PDF文档进行OCR识别。

另外,你还可以通过有道云笔记微信公众号使用图片OCR功能!只要在微信对话框内把图片发给云笔记,就能为你将图片识别成文字。就像这样↓

责编:远洋
纠错
下载IT之家APP,分享赚金币换豪礼
分享:

相关文章

IT之家 - 爱科技,爱这里。

© 2006 - 软媒公司 版权所有