问题标签 [tess-two]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
707 浏览

android - 如何通过下载和构建的 tess-2 在 Windows 7 上训练 Tesseract?

到目前为止,我已经使用 tess-two 构建了一个 ocr 应用程序。为了构建应用程序,我下载并构建了 tess-two 库(感谢 rmtheis!)。

我需要改进 OCR 输出,因为结果的准确率低于 20%。我只使用数字(0 到 9),我希望达到 100% 的准确度。

我已经按照我浏览过的一些博客的推荐下载了 ghostscript、vietocr 和 serak。它们比有关该主题的大多数其他条目更详细地涵盖了培训过程。(此处链接:Pradeep 的博客reachsri 网站

我的问题是;我必须再次下载 tesseact 应用程序吗?

培训中的某些步骤似乎暗示我将执行以“tesseract.exe”开头的命令,而我的计算机上没有任何此类文件。

我还需要下载 tesseract 应用程序吗?或者我可以和 tess-two 一起工作吗?

任何和所有的帮助将不胜感激。

0 投票
1 回答
2385 浏览

java - 无法使用 tess-two API 的 language=eng 初始化 Tesseract API

我正在尝试为我的 Android 应用程序实现 tess-two api,无论我如何尝试修复它,我都会收到此错误:

E/Tesseract(native): 无法使用 language=eng 初始化 Tesseract API!

我确实在 Manifest 中有 WRITE_EXTERNAL_STORAGE 权限。

同样在 tess-two 库的 TessBaseAPI.java 文件中,所有本机函数都显示

无法解析对应的JNI函数Java_com_googlecode_tesseract_android_TessBaseAPI_nativeClass

我应该如何解决这个问题?

0 投票
1 回答
1220 浏览

android - 增强 TessBaseAPI.getUTF8Text() 的可读性

我尝试在 Android 中通过 Tess-Two 使用 Tesseract OCR 来识别图像中的文本(使用 Android Studio 开发)。

在 gradle 中,我将以下行添加到依赖项部分:

然后,在主要活动中onCreate(),我有以下代码来初始化库并加载图像:

最后,我将 JPEG 文件放入资产文件夹 ( app/src/main/assets/)。这是JPEG,基本上是一段文字。

JPEG

但是,OCR 结果是(几乎是垃圾):

如何提高扫描的可读性?

我尝试了以下 Page Sec Mode,但结果为

0 投票
1 回答
700 浏览

android - android更新项目--path“路径”错误:目标无效(ubuntu)

我正在尝试在 android studio 中构建 tesseract 库。

abhimanyu@MyPC:~/Documents/tess-two-master/tess-two$ /home/abhimanyu/Android/Sdk/tools/android 更新项目 --path 。

错误:项目没有设置目标或目标无效。请为“android 更新”命令提供 --target。

那要指定什么路径呢?请帮助

0 投票
1 回答
308 浏览

java - 在 Android 上使用 Tesseract tess-two 拆分单词

我尝试使用 tesseract tess-two 从 android 中的图像中读取问题和答案。目前,我得到一个字符串,其中包含图像上的每个单词。我的问题是我无法拆分答案是否可以使用 TessBaseAPI 拆分答案?java/android 中的解决方案也可以;)

这是图像外观的示例

0 投票
1 回答
1051 浏览

android - 如何强制 tesseract 识别单个字符,而不是忽略它?

我一直在使用 tesseract(更准确地说是 tess-two)在 android 中制作一个应用程序来识别某些非常规符号。目的是识别符号并重定向到所述符号的描述。

这些符号几乎可以被完美地识别,无论它们是单独出现在图像中还是彼此相邻......除了两个(下面的那些)。

识别中省略的符号

这两个符号单独时无法识别,但如果它们与任何其他符号相邻,则可以正确识别它们。

例如:

未识别 _

正确识别

_ b

_是_

问题是它们没有与其他符号不匹配,而是完全被忽略了。我打电话时会出现这种情况:

TessBaseAPI baseApi;

...

字符串文本 = baseApi.getUTF8Text();

返回的字符串始终为空。就像它甚至不识别黑色区域一样。任何人都知道我该如何解决这个问题?

更新:

为了更清楚,这里是我初始化 tess 时的完整代码。

我的白名单范围从“a”到“t”,因为我制作了一种与我必须使用的符号相对应的字体,并将它们映射到每个字母。

0 投票
1 回答
1031 浏览

android - Tesseract 变量“save_blob_choices”如何工作?

所以我一直在尝试使用 tesseract ocr,(特别是 tess-two)来扫描一些符号。

一切正常,但有时识别的字符串返回为空。我发现的解决方案之一是将变量设置save_blob_choices为 true,以便让 tesseract 保存替代方案以供识别。

但我不知道它是否确实应该这样做。它在哪里保存替代品?我如何访问它们?

当然,如果您除了使用此变量之外还有其他解决方案,请告诉我。

这是我的代码:

另外作为一个额外的问题,base.setDebug(true)应该工作吗?因为它似乎什么也没做。

0 投票
0 回答
29 浏览

c++ - 错误 LNK2001:与 tesseract 链接时无法解析的外部符号

我无法在 MSVC 中解决此链接问题 LNK2001。

这个问题的根本原因是什么?是来自朋友班吗?

或者我以错误的方式调用了该函数。

我对 C++ 没有太多经验。请帮忙。

头文件:

.cpp 文件:

我已经实现的代码:

MSVC 的结果:

0 投票
1 回答
1464 浏览

tess-two - tessdata 文件夹的默认数据路径

我发现了一个奇怪的问题,即使我明确提到数据路径是 /data/local/tmp/tesseract/,TessBaseAPI 也会使用 /data/data/tesseract/ 中的 tessdata(仅当它存在时)。如果 /data/data 文件夹中不存在 tesseract 目录,则采用给定的路径。

我几乎搜索了整个 TessBaseAPI.java 文件,但找不到默认路径。

以下是代码:

你能告诉我默认数据路径是从哪里获取的吗?

0 投票
1 回答
1566 浏览

android - 将 tess-two(Tesseract Tools for Android)库集成到 Android 工作室并构建 ndk

我想在 android studio 中导入 tess-two 库,编译后在 ndk build 中显示错误。我已经尝试过在 stackoverflow 上给出的解决方案。像, 任务':app:compileDebugNdk'的执行失败, 但它没有解决我的问题。请建议我在哪里做错了。

它显示以下错误: