有道云笔记上线OCR功能：轻松识别图片/PDF中文字（支持汉字）

2017-05-17 17:31IT之家 - 远洋

IT之家5月17日消息，继上线语音速记功能后，网易旗下产品有道云笔记又上线了另一实用的功能——文档OCR(即文字识别)。据悉，新上线的OCR功能在原有的扫描功能进行了升级，能够帮助用户轻松识别图片、PDF等扫描文档中的文字，并将其转化成可编辑的文档。

如果你还不了解新功能OCR究竟能为你做什么，那你一定遇到过以下这些情况，而OCR功能就是对这些“症结”的那款“灵丹妙药”：

· 工作或者科研学习中，要应对大量的纸质文件、书刊杂志、PDF格式的电子资料，很难对这些格式的资料进行编辑和整理

· 读书时，看到不错的文章段落想要做书摘笔记，但又懒得去打字或是手抄整理

· 在微信、微博等内容平台看到有价值的图片内容会随手保存mark，或是用截屏把手机页面内容保存到相册，但这些图片信息散乱在手机各处，很难进行归纳、整理和检索

以上难题，只需要5秒就能搞定！

那么，如何用OCR识别功能将纸质资料、图片和PDF文件，转换为可以自由编辑的文本格式呢？

「纸质文档」OCR识别

把纸书、合同等纸质文件、甚至墙体海报，转换成可编辑的文本格式，只需三步：

step1：智能扫描

将有道云笔记升级为最新版后，点击加号按钮，新建一篇“文档扫描”。

接下来就是见证实力的时刻，扫描过程中无需任何人工操作，软件可以自动、精准识别扫描图像的边框，去除扫描区域以外的多余背景，并且矫正偏斜，稳！准！狠！地将资料扫描进来。

如果对自动扫描结果不够满意，还可以选择手动调节模式进行微调。

在扫描过程中，请尽量将文字摆正，尽量剔除图片中无关的部分，这样可以大大提高文字识别的准确度啊~

step2：扫描图片滤镜美化

扫描后的图片会自动调节亮度和对比度，可以便捷的设置为增强或黑白模式，让图片更清晰。

step3：OCR识别，提取图片内文字

在进行OCR之前，请先将扫描文档进行同步保存。选择需要进行文字识别的图片后，点击底部的“识别”按钮，就能将这张扫描图片内的文字识别出来并转换成一篇文字笔记。

识别出的文本会直接保存到有道云笔记内，多平台同步，你可以在手机版、PC端、网页端等任意平台的有道云笔记内进行修改、编辑、整理。

在扫描图片足够清晰的情况下，文本识别的准确率可以达到95%以上。

原图片

识别文字

「图片」OCR识别

如何将那些“锁在”图片里的文字提取出来？我们用一张hin长（包含了2000多字内容）的微博长图来为大家演示图片OCR的用法和文字识别效果。

首先，进入有道云笔记，选择“上传图片”，将要识别处理的图片同步保存到有道云笔记。

然后，在页面底部找到“更多”按钮，点击“文本识别OCR”，就可以看到长图内的文字被完美识别出来了！

虽然网络图片的分辨率不是很高，并且单张图片文字内容较多，但是文字识别效果一点不含糊。

图片 ←→ 识别文本

「PDF文档」OCR识别

除扫描文档、图片外，有道云笔记（限会员）还可以PDF文本识别服务，PDF轻松转Word！

将PDF文档上传到有道云笔记，并完成同步后，点击底部的“OCR”按钮，经过几秒的等待后（视PDF文档大小而定），就可以看到PDF内的文字被识别出来，轻松转化为可以自由编辑的笔记格式。

PDF文档

识别文本

目前双栏布局PDF文档的文本识别支持度较差，暂时建议选择一栏布局的PDF文档进行OCR识别。

另外，你还可以通过有道云笔记微信公众号使用图片OCR功能！只要在微信对话框内把图片发给云笔记，就能为你将图片识别成文字。就像这样↓

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。