问题标签 [tesseract]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
8589 浏览

multithreading - tesseract 3.00 是多线程的吗?

我阅读了其他一些帖子,建议他们将在 3.00 中添加多线程支持。但我不确定它是否在 3.00 发布时添加。

除了多线程之外,运行 tesseract 的多个进程是否是实现并发的可行选择?

谢谢。

0 投票
0 回答
699 浏览

image-processing - 使用 ImageMagick、OCR、JavaScript 将标记图像 (EPS) 转换为交互式网页

Business Insight: 我们处于教育领域,我们需要将标记图像(EPS) 自动转换为学生使用的交互式练习(使用 HTML/SVG/JavaScript)。

技术见解: 分层 EPS 文件是我们从出版商那里得到的。EPS 文件应转换为两个 PNG 文件:[1.png]只有标签文本[2.png]除标签文本外的所有其他文件。

然后[1.png]应该通过一些高级 OCR (?) 程序运行,该程序应该输出标签文本及其在图像中的位置(X,Y 坐标)。然后可以使用 HTML/JavaScript 将标签文本覆盖在[ 2.png] 上,以及使用 JavaScript 进行拖放等交互。

到目前为止尝试过: 手动将 EPS 转换为 PNG,并使用 ImageMagick 和 Tessaract OCR 单独获取标签文本。

问题: 图像处理的上述要求(EPS->PNG+带有坐标的文本标签)可以自动化到什么程度,可以使用哪些最佳工具?提前感谢帮助。

PS:我是一名 UI 开发人员,可以处理 HTML/JavaScript 部分,如果只为标签提供坐标。

0 投票
1 回答
396 浏览

c# - 从光标下的单词中获取图片进行 OCR 处理

嗨 Fox 我想检测光标下的单词并从中获取图像(如巴比伦)。但我不知道如何获取光标下抓取单词的屏幕区域。

谢谢你的帮助

0 投票
4 回答
19839 浏览

tesseract - Tesseract 和 tiff 格式 - spp 不在集合 {1,3} 中

尝试运行此命令时:

我得到下一个错误

假设这spp not in set是这里的主要错误,那是什么意思?起初它遇到了麻烦,因为 bpp 高于 24,所以我使用 Gimp 降低了它,但这并没有解决问题。

0 投票
1 回答
1951 浏览

tesseract - mftraining阶段的Tesseract问题


在运行 unicharset_extractor 之后,我已经成功地创建了一个带有 tesseract 的盒子文件,
它创建了如下所示的 unicharset 文件:

我继续执行此命令

只是为了得到下一个错误

0 投票
2 回答
15659 浏览

ocr - 我可以使用 OCR 检测字体样式(粗体、斜体)吗?

我对使用 OCR 从简单文本中提取粗体和斜体字感兴趣。例如,如果我输入带有如下文本的清晰图像:

“敏捷的跳过懒惰的狗。”

我想得到这样的输出:bold("brown", "jumps"), italic("lazy")

我已经研究过用 OCRopus 或 Tesseract 来做这件事,但是文档很差,我不知道它是否可能,或者如果它是怎么做的。

0 投票
1 回答
6640 浏览

android - 在 Android 中集成 Tesseract OCR 引擎

我们如何在我们的 Android 项目中使用 Tesseract OCR 引擎来读取图像中的字符..如何在 android 上安装它?请帮忙

0 投票
2 回答
5749 浏览

c# - c# OCR 无法识别数字(tesseract 2)

我正在尝试从以下内容中提取数字:

它失败了,我得到一个作为回报。我正在使用谷歌的 tesseract 2,使用 C#(开源 c# 包装器),现在我想知道,这张图片是否太糟糕而不能用于 OCR?

因为恕我直言,数字很清楚。

您是否有任何其他 OCR 引擎可以解决这个问题?

编辑

我也尝试过使用Asprise OCRhttp://asprise.com/product/ocr/selector.php),但它也无法解析图像......

0 投票
2 回答
15529 浏览

ocr - Tesseract OCR 培训的替代方案?

在过去的 3 个月里,我一直在尝试训练 Tesseract
识别我拥有的一组图像,由于确实缺乏
适当的文档,并且非常复杂,我开始
放弃将 Tesseract 作为一个解决方案。

我正在寻找一种替代方法,它对训练来说相对无痛
,我不想在这里重新发现轮子。

如果没有任何免费的东西,我想付费解决方案将
不得不做(不超过 200 美元)

0 投票
3 回答
4019 浏览

vb.net - 在 VB.net 中使用 Tesseract 时出现奇怪的错误

我有当前的代码:

我只有一个普通的 RichTextBox 和表单上的一个按钮。我在调试目录中也有一个名为“image.png”的图像。

每次我运行它时,程序都会关闭。我做了一步,突然出现一个文件定位器,询问“tessnet2.cpp”

我有对 dll 的引用。我也不知道 ocr.Init(...) 行的用途。

你能帮忙的话,我会很高兴!