问题标签 [tesseract]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

3986 问题

0 投票

3 回答

8589 浏览

multithreading - tesseract 3.00 是多线程的吗？

我阅读了其他一些帖子，建议他们将在 3.00 中添加多线程支持。但我不确定它是否在 3.00 发布时添加。

除了多线程之外，运行 tesseract 的多个进程是否是实现并发的可行选择？

谢谢。

multithreading tesseract

2011-02-10T21:34:39.740

0 投票

0 回答

699 浏览

image-processing - 使用 ImageMagick、OCR、JavaScript 将标记图像 (EPS) 转换为交互式网页

Business Insight： 我们处于教育领域，我们需要将标记图像(EPS) 自动转换为学生使用的交互式练习（使用 HTML/SVG/JavaScript）。

技术见解： 分层 EPS 文件是我们从出版商那里得到的。EPS 文件应转换为两个 PNG 文件：[1.png]只有标签文本[2.png]除标签文本外的所有其他文件。

然后[1.png]应该通过一些高级 OCR (?) 程序运行，该程序应该输出标签文本及其在图像中的位置（X，Y 坐标）。然后可以使用 HTML/JavaScript 将标签文本覆盖在[ 2.png] 上，以及使用 JavaScript 进行拖放等交互。

到目前为止尝试过： 手动将 EPS 转换为 PNG，并使用 ImageMagick 和 Tessaract OCR 单独获取标签文本。

问题： 图像处理的上述要求（EPS->PNG+带有坐标的文本标签）可以自动化到什么程度，可以使用哪些最佳工具？提前感谢帮助。

PS：我是一名 UI 开发人员，可以处理 HTML/JavaScript 部分，如果只为标签提供坐标。

image-processing imagemagick ocr tesseract

2011-02-12T18:26:06.943

0 投票

1 回答

396 浏览

c# - 从光标下的单词中获取图片进行 OCR 处理

嗨 Fox 我想检测光标下的单词并从中获取图像（如巴比伦）。但我不知道如何获取光标下抓取单词的屏幕区域。

谢谢你的帮助

c#c++ocr tesseract

2011-02-21T14:46:32.413

0 投票

4 回答

19839 浏览

tesseract - Tesseract 和 tiff 格式 - spp 不在集合 {1,3} 中

尝试运行此命令时：

我得到下一个错误

假设这spp not in set是这里的主要错误，那是什么意思？起初它遇到了麻烦，因为 bpp 高于 24，所以我使用 Gimp 降低了它，但这并没有解决问题。

tesseract

2011-02-22T20:22:51.643

0 投票

1 回答

1951 浏览

tesseract - mftraining阶段的Tesseract问题

在运行 unicharset_extractor 之后，我已经成功地创建了一个带有 tesseract 的盒子文件，
它创建了如下所示的 unicharset 文件：

我继续执行此命令

只是为了得到下一个错误

tesseract

2011-02-22T21:50:13.490

0 投票

2 回答

15659 浏览

ocr - 我可以使用 OCR 检测字体样式（粗体、斜体）吗？

我对使用 OCR 从简单文本中提取粗体和斜体字感兴趣。例如，如果我输入带有如下文本的清晰图像：

“敏捷的棕狐跳过了懒惰的狗。”

我想得到这样的输出：bold("brown", "jumps"), italic("lazy")

我已经研究过用 OCRopus 或 Tesseract 来做这件事，但是文档很差，我不知道它是否可能，或者如果它是怎么做的。

ocr font-face tesseract

2011-03-02T04:17:13.967

0 投票

1 回答

6640 浏览

android - 在 Android 中集成 Tesseract OCR 引擎

我们如何在我们的 Android 项目中使用 Tesseract OCR 引擎来读取图像中的字符..如何在 android 上安装它？请帮忙

android ocr tesseract

2011-03-15T09:02:24.793

0 投票

2 回答

5749 浏览

c# - c# OCR 无法识别数字（tesseract 2）

我正在尝试从以下内容中提取数字：

它失败了，我得到一个〜作为回报。我正在使用谷歌的 tesseract 2，使用 C#（开源 c# 包装器），现在我想知道，这张图片是否太糟糕而不能用于 OCR？

因为恕我直言，数字很清楚。

您是否有任何其他 OCR 引擎可以解决这个问题？

编辑

我也尝试过使用Asprise OCR（http://asprise.com/product/ocr/selector.php），但它也无法解析图像......

c#ocr tesseract

2011-03-29T15:45:16.590

0 投票

2 回答

15529 浏览

ocr - Tesseract OCR 培训的替代方案？

在过去的 3 个月里，我一直在尝试训练 Tesseract
识别我拥有的一组图像，由于确实缺乏
适当的文档，并且非常复杂，我开始
放弃将 Tesseract 作为一个解决方案。

我正在寻找一种替代方法，它对训练来说相对无痛
，我不想在这里重新发现轮子。

如果没有任何免费的东西，我想付费解决方案将
不得不做（不超过 200 美元）

ocr tesseract

2011-04-01T06:06:32.900

0 投票

3 回答

4019 浏览

vb.net - 在 VB.net 中使用 Tesseract 时出现奇怪的错误

我有当前的代码：

我只有一个普通的 RichTextBox 和表单上的一个按钮。我在调试目录中也有一个名为“image.png”的图像。

每次我运行它时，程序都会关闭。我做了一步，突然出现一个文件定位器，询问“tessnet2.cpp”

我有对 dll 的引用。我也不知道 ocr.Init(...) 行的用途。

你能帮忙的话，我会很高兴！

vb.net ocr tesseract

2011-04-10T01:40:49.877

1 2 3 4 5 6 7 8 9 10