问题标签 [tesseract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tesseract - 如何获取已识别字符的坐标
我有一个非常简单的基于 Tesseract 的 OCR 应用程序。在识别步骤之后,我还提供了一个用户验证步骤,允许在 OCR 错误的情况下进行更正。为了改善用户界面,我计划在原始输入图像的 OCR 字符顶部绘制一个矩形,并将其与 OCR 输出并排放置。为此,我需要识别字符的坐标。
我尝试过这样的事情,但它似乎让我胡言乱语:
现在,如果我访问 output->count,它会给我一些高于 10,000 的值,这显然是错误的,因为整个图像只有 20 个左右的字符。
我在正确的轨道上吗?请问可以指点一下吗?
android - 通过android NDK编译tesseract
我正在尝试使用 android ndk r5 为 android 编译 tesseract,通过查看http://code.google.com/p/tesseract-android-tools/获得 tesseract 的代码,我无法编译 tesseract 并出现错误,
请帮我解决这个问题。
ocr - 训练正方体
我正在尝试训练 tesseract 识别一些图像,但手册不清楚,你知道任何简单直接的训练 tesseract 指南吗?
谢谢你。
android - Tesseract Android 工具崩溃错误
我在TessBaseAPI
课堂上的 init 方法出现崩溃错误,请帮助我解决这个问题,以下是日志文件:
xcode - Xcode 中的 EXC_BAD_ACCESS 错误
我真的需要你们的帮助,我在 Xcode 中运行我的程序并且它成功但后来,
它向我显示了这个错误: **线程 1:程序收到信号:在我的程序行上我有**bold的“EXC_BAD_ACCESS”:
谢谢你。
performance - 如何提高 Tesseract / Tessnet2 的识别速度和准确率?
我已经看到要限制扫描错误,您可以为字符定义白名单。
但我在ocr.Init(@"c:\temp", "fra", false);
假设您只想扫描数字:将白名单设置为“0123456789”对于获得最佳识别结果是正确的,但是 Init 方法的 numericMode 参数有什么作用?即使白名单是“0123456789”,我也一直认为它是错误的。
还有什么是图像馈送到 tessnet 的最佳位图参数(像素格式)。
tesseract - 连接手写识别器的最佳方式是什么?
我尝试用未连接的字母训练 tesseract,效果很好。
但我想知道我是否可以识别带有连接字母的笔迹。
我对开源方法更感兴趣。
感谢您的任何想法。
c++ - 图像处理库
我需要一个主要用于颜色处理的库,我想让图像变成黑白,并增加对比度,以便 Tesseract(Google OCR 库)可以更好地阅读我扔给它的图像。
或者,如果有人对如何改进 Tesseract 结果有更好的想法,我完全赞成。
java - 为 tesseract-android-tools (android) 加载训练数据
我正在开发安卓应用程序。我需要的是训练数据文件的直接路径(初始化 tesseract)。看起来最好的选择是将资源设置为原始。
我以这种方式获取资源 ID(文件名是:deu.traineddata):
好的,'rID' > 0,现在得到 Stream :
好的,'是'!= null。但是现在遇到问题了,通过阅读'is' IOException 已被抛出,没有堆栈跟踪:
我也尝试从资产中读取文件,但从 InputStream 中读取也是同样的问题。我做错了什么,还有其他方法可以获取资源路径吗?谢谢安德烈
tesseract - 如何在 C# 上使用 tesseract 阅读其他语言
我正在尝试在 c# 上运行 tesseract。该程序适用于英语语言'ocr.Init(@"C:\Program Files\Tesseract-OCR\tessdata", "eng", false);' 如果我尝试将语言从“eng”更改为“ita”,程序会生成错误并且无法运行。目录“.../tessdata”包含“ita.traineddata”和其他 ita。文件。我使用库 tessnet2.dll。
谢谢,亚历山德罗。