问题标签 [tesseract]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
9563 浏览

tesseract - 如何获取已识别字符的坐标

我有一个非常简单的基于 Tesseract 的 OCR 应用程序。在识别步骤之后,我还提供了一个用户验证步骤,允许在 OCR 错误的情况下进行更正。为了改善用户界面,我计划在原始输入图像的 OCR 字符顶部绘制一个矩形,并将其与 OCR 输出并排放置。为此,我需要识别字符的坐标。

我尝试过这样的事情,但它似乎让我胡言乱语:

现在,如果我访问 output->count,它会给我一些高于 10,000 的值,这显然是错误的,因为整个图像只有 20 个左右的字符。

我在正确的轨道上吗?请问可以指点一下吗?

0 投票
3 回答
4171 浏览

android - 通过android NDK编译tesseract

我正在尝试使用 android ndk r5 为 android 编译 tesseract,通过查看http://code.google.com/p/tesseract-android-tools/获得 tesseract 的代码,我无法编译 tesseract 并出现错误,

请帮我解决这个问题。

0 投票
0 回答
1752 浏览

ocr - 训练正方体

我正在尝试训练 tesseract 识别一些图像,但手册不清楚,你知道任何简单直接的训练 tesseract 指南吗?

谢谢你。

0 投票
1 回答
771 浏览

android - Tesseract Android 工具崩溃错误

我在TessBaseAPI课堂上的 init 方法出现崩溃错误,请帮助我解决这个问题,以下是日志文件:

0 投票
2 回答
794 浏览

xcode - Xcode 中的 EXC_BAD_ACCESS 错误

我真的需要你们的帮助,我在 Xcode 中运行我的程序并且它成功但后来,

它向我显示了这个错误: **线程 1:程序收到信号:在我的程序行上我有**bold的“EXC_BAD_ACCESS”

谢谢你。

0 投票
2 回答
3697 浏览

performance - 如何提高 Tesseract / Tessnet2 的识别速度和准确率?

我已经看到要限制扫描错误,您可以为字符定义白名单。

但我在ocr.Init(@"c:\temp", "fra", false);

假设您只想扫描数字:将白名单设置为“0123456789”对于获得最佳识别结果是正确的,但是 Init 方法的 numericMode 参数有什么作用?即使白名单是“0123456789”,我也一直认为它是错误的。

还有什么是图像馈送到 tessnet 的最佳位图参数(像素格式)。

0 投票
1 回答
154 浏览

tesseract - 连接手写识别器的最佳方式是什么?

我尝试用未连接的字母训练 tesseract,效果很好。

但我想知道我是否可以识别带有连接字母的笔迹。

我对开源方法更感兴趣。

感谢您的任何想法。

0 投票
1 回答
505 浏览

c++ - 图像处理库

我需要一个主要用于颜色处理的库,我想让图像变成黑白,并增加对比度,以便 Tesseract(Google OCR 库)可以更好地阅读我扔给它的图像。

或者,如果有人对如何改进 Tesseract 结果有更好的想法,我完全赞成。

0 投票
1 回答
893 浏览

java - 为 tesseract-android-tools (android) 加载训练数据

我正在开发安卓应用程序。我需要的是训练数据文件的直接路径(初始化 tesseract)。看起来最好的选择是将资源设置为原始。

我以这种方式获取资源 ID(文件名是:deu.traineddata):

好的,'rID' > 0,现在得到 Stream :

好的,'是'!= null。但是现在遇到问题了,通过阅读'is' IOException 已被抛出,没有堆栈跟踪:

我也尝试从资产中读取文件,但从 InputStream 中读取也是同样的问题。我做错了什么,还有其他方法可以获取资源路径吗?谢谢安德烈

0 投票
1 回答
961 浏览

tesseract - 如何在 C# 上使用 tesseract 阅读其他语言

我正在尝试在 c# 上运行 tesseract。该程序适用于英语语言'ocr.Init(@"C:\Program Files\Tesseract-OCR\tessdata", "eng", false);' 如果我尝试将语言从“eng”更改为“ita”,程序会生成错误并且无法运行。目录“.../tessdata”包含“ita.traineddata”和其他 ita。文件。我使用库 tessnet2.dll。

谢谢,亚历山德罗。