问题标签 [ocr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
67391 浏览

java - 我应该在 Android 中使用哪种 OCR Java 库?

我想构建一个 Android 应用程序,它应该通过 OCR 库扫描图片并从中提取文本。

我应该使用什么 Java 库?

0 投票
1 回答
1175 浏览

wpf - WPF InkCanvas - 如何确定它是否已“签名”

我正在使用 WPF InkCanvas 控件来捕获 Tablet PC 应用程序中的签名。

我的要求之一是验证应用程序是否真的已“签名”。现在我通过检查 InkCanvas 的 Strokes 集合来执行此操作 - 如果有 0 个笔划,那么我知道用户没有“签名”。

但是,如果用户输入一个斜线,甚至一个点,这算作一个笔划,我的验证测试将通过,即使签名不是真的有效。

关于如何为此建立更好的测试的任何想法?诚然,什么是有效签名和什么不是有效签名的用例非常模糊,但我想尝试消除明显不好的签名。

或者这是否以任何直接的方式根本无法解决?

0 投票
2 回答
3504 浏览

c# - 如何从 C# 调用 Acrobat 功能 OCR?

我想编写一个可以利用 Adob​​e Acrobat 中的 OCR 功能的 C# 应用程序。我怎么称呼这个?有公共 API 吗?

0 投票
1 回答
599 浏览

text - 快速字符检测

我不想知道它在说什么,也不会像 CAPTCHA 那样处理任何失真,我只想知道一堆图像是否包含任何文本。

这将在几个空闲的 Linux 服务器上运行,一个 cron 作业将每天多次处理大量图像。

在此过程中,我想做的一件事是丢弃任何带有文本的图像。我不介意一些误报,但在识别带有应尽可能丢弃的文本的图像时,我希望尽可能接近零失败率。

0 投票
4 回答
452 浏览

pdf - 议会辩论 PDF 的光学字符识别

对于合同工作,我需要将来自德国联邦议会的许多旧的、仅扫描图形的全体辩论协议 PDF 数字化。

问题是这些文件中的大多数都有两列格式:

示例协议 http://sert.homedns.org/img/btp12001.png

我很想阅读您对以下问题的回答:

  1. 在将两列输入 OCR 之前如何拆分它们?
  2. 您推荐哪种商业、开源 OCR 软件或框架,为什么?

请注意,任何工具、编程语言、框架等都可以。不要犹豫,推荐深奥的产品,图书馆,如果你认为它们被剪掉了^__^!!

更新:这些文件已经被议会扫描 o_O:样本(与上图相同),其中有很多,我想尽快交付合同,所以我不能去获取相同文件的打印副本,剪切并亲自扫描它们。他们太多了。

最好的问候,
Cetin Sert

0 投票
6 回答
143002 浏览

android - 是否有适用于 Android 的免费 OCR 库?

我正在寻找在 Android 上运行的 Java OCR,但是 Asprise 似乎不是独立于平台的 OCR。是否有任何开源/免费的 Java OCR 可用于 android 应用程序开发?

0 投票
7 回答
11073 浏览

c# - .NET OCR 处理图像

我正在尝试使用 MODI 对窗口程序进行 OCR。它适用于我使用 win32 互操作以编程方式抓取的屏幕截图,如下所示:

然后将此图像保存到文件中并像这样通过 MODI 运行:

这部分工作正常,但是,我不想 OCR 整个屏幕截图,只是其中的一部分。我尝试像这样以编程方式裁剪图像:

然后 OCRing 这个较小的图像,但是 MODI 抛出异常;'OCR 运行错误',错误代码是-959967087。

为什么 MODI 可以处理原始位图,但不能处理从中提取的较小版本?

0 投票
3 回答
3263 浏览

image-processing - 图像处理/超轻OCR

我有 55 000 个图像文件(JPG 和 TIFF 格式),它们是书中的图片。

每个页面的结构是这样的:

一些文字

---(水平线)---

一个号码

一些文字

---(水平线)---

另一个号码

一些文字

任何给定页面上可以有 0 到 4 条水平线。

我需要找到数字是多少,就在水平线的下方。

但是,数字严格遵循彼此,从第一页的一个开始,所以为了找到数字,我不需要阅读它:我可以检测水平线的存在,这应该既容易又安全尝试对页面进行 OCR 以检测数字。

该算法基本上是:

问题是:执行“计算水平线”部分的最佳图像库/语言是什么?

0 投票
3 回答
1747 浏览

iphone - 如何识别 iphone sdk 中的图像?

我想问一下,有没有识别图像的api?

我需要从图像中读取数据...我可以读取打印在图像上的数字吗...

0 投票
4 回答
8831 浏览

python - OCR 扑克牌

我决定做一个有趣的项目,我想将扑克牌的图像作为输入并返回其等级和花色。我认为我只需要查看左上角,因为它包含所有信息。它应该是健壮的——如果我有一张钻石王牌的大图像,我应该能够将它缩放到 20% 到 200% 的任何位置,并且仍然得到正确的答案。

第一个问题 - 是否有任何已经写过的东西可以做到这一点?如果是这样,我会为 OCR 找到其他东西,所以我不会重复这些努力。

第二 - 这样做的最佳方法是什么?神经网络?手工编码的东西?任何人都可以提供任何指示吗?(0xCAAF9452 不是可接受的答案)。