首页>中国>手机>正文

iText - OCR 截图识字 | Toolinbox

国家：中国类型：手机

标签：文字识别 OCR

中文网站： https://toolinbox.net/iText/ 进入网站

iText 是一款从图片中识别文字的 OCR 工具。

典型使用场景：

从扫描版 PDF 中提取文字
从朋友发来的图片中识别文字
从任意图片中识字

产品特色

1 选取图片方便
iText 支持多种方式选择图片，操作非常便利。

1.1 截图即识字
iText 自带截图功能，只需按下 ⇧⌘1 快捷键、截取屏幕任意位置，即可提取该图片中的文字。

小提示：识别后的文字已经复制到系统剪贴板，直接粘贴即可。

1.2 拖拽图片至菜单栏图标识字
比如，当你在电脑上使用微信、QQ 时，好友发了张图片（比如手机拍摄的快递单），你想识别其中的文字（比如快递单号），只需将该图片拖拽至 iText 菜单栏图标即可。

1.3 选择图片文件识字
当然，也可以在对话框中选择图片文件。不过，个人还是建议你直接把该图片文件拖拽至 iText 菜单栏图标，操作直观高效。

1.4 支持连续识别
比如，连续截取 PDF 不同位置的图片，iText 将依次识别其中的文本，并自动将结果拼接在一起。

2 文字识别精准
你有没有这种经历：你想从一张图片中提取文字，结果发现识别的文字中有一些错误。结果，手动修改这些错误的时间，比自己直接在电脑上码字的时间还要长。是不是很尴尬？

可见，识别的准确性非常重要，也是我非常在意的一点。

2.1 腾讯、百度、Google 三引擎
首先，我排除了离线的识别库，因为离线注定了这些库的识别能力是死的，不会自己增强。接下来，在一票在线 OCR 服务中，我对比了百度、腾讯、微软、Google 这些四家大厂的产品，最后选择了国内使用腾讯及百度、国外使用 Google 的组合。

如果你有 Google 信仰、或者需要识别日文等其他语言，可以右击 iText 菜单栏图标，手动选择使用腾讯、百度或 Google OCR 服务。不过，从实测和目前优化的情况来看，中文还是建议使用腾讯；大家可以自行测试。

那么，到底识别准不准呢？这么说吧：

对于一般的自然语言，比如书中的一段话、新闻稿，识别效果是惊人的准确，甚至可以达到 100%
对于排版复杂、尤其有特殊字符的文字，比如程序代码、选择题，识别效果就不太理想，需要手动对识别后的结果进行修正

比如，单纯地给一个竖线，机器是无法区分到底是小写的 l、还是大写的 I（顺便问一下，你看出二者的区别了吗？）；与之相对，机器是需要根据上下文进行判断和优化的。而像程序代码这种非自然语言，机器目前是很难进行语义识别的
到底准不准？欢迎你来试试。

2.2 独创算法，进一步优化识别结果
OCR 服务完成最好的是字符的识别；但更进一步的识别，目前还不是很好，比如段落的识别、全角半角符号等等，这就需要程序后期进行优化。

目前，iText 主要完成了这些部分的优化：

自动识别段落
中文环境使用全角标点符号
中文与英文字母、数字间增加空格
删除中文字符间、英文字符与标点符号间的多余空格
英文首字母大写
如果你发现优化的不好的地方，欢迎把图发给我，我会相应地优化算法，先谢。

2.3 预览原图，方便校对
在目前 OCR 技术不能始终达到 100% 的情况下，预览原图、并进行修正，还是有必要的。在 iText 中，你可以这样：

将识别后的窗口拖到图片附近
调用 iText 识别结果的双栏模式：左侧展示图片、右侧展示识别后的文字
可使用快捷键 ⇧⌘R 快速调出识别结果窗口

这样，就可以很方便地对照原图进行手动优化识别后的文字。

2.4 自动隐藏识别结果
由于 iText 的识别结果已经非常准确，且已经复制到剪贴板，因此识别后并不需要编辑或复制文本。此时，你可以如上图所示，开启「自动隐藏」选项，识别结果窗口将会在 3s 后自动隐藏，非常方便。

并且，如果临时需要编辑某次识别结果，只要将鼠标移至结果窗口，则会暂时忽略自动隐藏功能。另外，开启「总在最前」选项后，窗口将不会自动隐藏。

3 识别后自动翻译
比如，对于英文版的 PDF、未翻译的字幕、未汉化的游戏，直接用 iText 截图，自动翻译为中文。

集成 Google、百度双引擎（优先选用 Google，当无法访问 Google 时使用百度），支持 100+ 种语言。

4 下载与付费
每月可免费识别 20 次，充分体验产品功能；订阅 iText 高级版即可无限次识别。

Fitocracy | 健身社区和挑战平台

Fitocracy是一个健身社区和挑战平台，旨在帮助用户建立健康的生活习惯并提高运动水平。该平台通...

标签: 健身社区健身计划保持运动

浏览次数: 18 2024-01-30

识字体网 | 在线图片字体识别扫一扫网站

识字体网是免费在线字体识别、品牌识别、字体下载、字体搜索和问答社区网站，免费下载Windows、ma...

标签: 字体识别字体查询求字体搜字体

浏览次数: 656 2023-12-09

达观数据-曹植GPT大语言模型

基于GPT语言大模型的AIGC文本生成是一种新型创作方式。达观数据持续探索和实践企业服务大语言模型研...

标签: GPT AIGC 智能写作

浏览次数: 39 2023-07-29

内蒙古大学

【历史沿革】内蒙古大学位于内蒙古自治区首府、历史文化名城呼和浩特市，距北京400余公里，是中华人民...

标签: 内蒙古大学内蒙古

浏览次数: 41 2022-06-24

Photocritic | 免费摄影学校

几十年来，我们一直在教授摄影。通过数百个研讨会和数十本书，我们知道是什么让人们兴奋不已。我们知道...

标签: 摄影

浏览次数: 45 2022-04-29

Hamster Land | 仓鼠乐园

仓鼠乐园（Hamster Land）是美国一个为仓鼠喂养者提供建议和信息的网站。该网站提供了包括如何...

标签: 仓鼠

浏览次数: 49 2022-04-08

转易侠扫描王 - 软件轻松转换照片,图片,证件上的信息为文字

转易侠扫描王软件提供了把图片照片上的文字扫描成文本的功能，简称OCR。它即可识别印刷字体，也可识别...

标签: 图片转文字 OCR文字识别

浏览次数: 39 2022-04-05

姬长信API For Docker官方文档-api.isoyu.com

姬长信API 一个基于多种编程语言并运行在Docker上开源免费不限制提供生活常用,出行服务,开发...

标签: Docker 生活常用出行服务开发工具

浏览次数: 158 2022-03-25

万彩办公大师 - 免费的办公工具百宝箱OfficeBox

万彩办公大师OfficeBox是一款由广州万彩信息技术有限公司研发的免费办公工具软件超级套装，几乎可...

标签: 办公

浏览次数: 286 2021-11-14

MangaEditor 1.41 - 一个修改漫画的小工具

Manga Editor 是一个自带翻译的在线版漫画编辑器工具，用户可以通过该工具对自己喜欢的漫画进...

标签: 在线版漫画编辑器

浏览次数: 543 2020-11-05

导航频道推荐

前端开发导航搜图导航

热门国家

中国美国英国加拿大德国日本法国荷兰澳大利亚意大利瑞士朝鲜新加坡西班牙瑞典俄罗斯爱尔兰印度以色列芬兰

热门网站类型

大学工具网络教育 | 学习商业素材手机生活创意文化新闻 | 资讯音乐杂志企业博客政府视频旅游购物游戏

热门网站

ArtStation | 艺术站书签地球 - 中国首家浏览器书签共享搜索引擎平台面包多 - 为创作者创收 ACG里世界 | 一个精神世界的二次元网站图悦-在线词频分析工具-词云图制作软件好读|中文电子书公益网二次元分享交流网站 - 漫画堆信息名单 – 发现好看的小说和电影，找到优秀的网站及应用。新片场 - 发现全球优质视频与创作人，与百万创作人一起成长番组计划 - Bangumi 站搜搜导航-寻找,收藏,分享网站 Jiumo Search 鸠摩搜索 - 文档搜索引擎

典型使用场景：

产品特色

相关推荐