问题标签 [tess4j]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Tesseract ocr 性能很慢
我使用 tesseract 3 的包装器 tess4j 对西里尔字符进行 OCR。在我执行图像预处理之前:倾斜图像、去除背景和噪声、调整图像质量并最终获得 OCR 的 ROI。图像预处理需要 0.5-1 秒。但是 tesseract OCR 过程需要很长时间。
如何提高 tesseract OCR 速度性能?
tess4j - tess4j 和 tess-two 之间的惊人差异
当我确切地知道我想要 OCR 的文本在屏幕上的位置时,tess-two 似乎工作得很好。
现在我正在尝试在繁忙的背景下扫描文本,但效果不佳。 带注释的安卓截图
我使用 tess4j 构建了一个独立的驱动程序,我得到了明显更好的结果:带 注释的桌面截图
我正在使用tess-two 5.4.1
和tessj4 3.0
。
扫描我正在使用TessBaseAPI.PageSegMode.PSM_SPARSE_TEXT_OSD and
迭代使用TessBaseAPI.PageIteratorLevel.RIL_TEXTLINE
任何想法为什么结果如此不同?tess4j 是否会进行某种预处理以产生更好的结果?
提前致谢!
java - Java 代码在创建为独立的静态主类时工作正常,但在从 servlet 调用时却不行
我正在使用 Tess4j API 执行 OCR,并在 eclipse 中创建了一个动态 Web 项目。如果我直接在 Java 资源文件夹下创建一个新的 Java 类,则代码工作正常。
但是,当我从我的 Servlets doPost 方法调用相同的代码时,我遇到了一个异常。
我已经在 WEB-INF 的 lib 文件夹下包含了所有需要的 jar。还在项目构建路径中添加了 jar。谁能让我知道我做错了什么。
异常:
java.lang.IllegalStateException:未设置输入
23:33:45.002 [http-bio-8080-exec-5] 错误 net.sourceforge.tess4j.Tesseract - 未设置
输入 java.lang.IllegalStateException:未设置输入
java - tess4j 中缺少 slf4j
我想测试 tess4j 做 OCR。我将以下教程用于第一个示例:http ://tess4j.sourceforge.net/codesample.html 我包含了所需的库,但出现以下错误:
有谁知道这个的解决方案?
java - 如何在java中找到使用tesseract提取的OCR文本的置信度?
- 我正在使用上面的代码。
- 使用 com.googlecode.tesseract.android.TessBaseAPI;图书馆
- 但是在线程“main”java.lang.UnsatisfiedLinkError 中出现异常:java.library.path 中没有 lept
- 使用 tesseract android jar 需要哪个 dll?
java - 测试 tess4j 并得到 UnsupportedClassVersionError
我想在 Eclipse 中使用 tess4j 进行测试。遵循教程后,我在运行它时仍然遇到 UnsupportedClassVersionError 。我正在使用 jdk 1.6.0 并出现此错误。
根据我阅读的解决方案,我必须升级我的 jdk 版本。还有其他方法让它仍然使用我拥有的jdk版本吗?如何解决此问题以使其与我拥有的现有 jdk 兼容。或者我必须使用这个 tess4j 的以前版本,否则?
android - Android:Tesseract 无法加载任何语言
大家好,我正在尝试运行 Tesseract 并从图像中获取文本,但遇到以下错误:
我正在加载一个jpg
包含英文文本的图像文件。这就是我尝试加载文件然后尝试从中获取文本的方式:
我也在我的项目中使用Maven
,这是我的pom
文件:
此错误的原因可能是什么?
java - 在进行字符识别之前使用 OpenCV 进行图像预处理(tesseract)
我正在尝试开发用于车牌识别的简单 PC 应用程序(Java + OpenCV + Tess4j)。图像不是很好(进一步它们会很好)。我想为 tesseract 预处理图像,但我一直在检测车牌(矩形检测)。
我的步骤:
1) 源图像
2) 灰度
3) 高斯模糊
4) 自适应阈值
这里应该是第 5 步,即检测板块区域(现在可能甚至没有去偏斜)。
我用Paint从图像中裁剪了需要的区域(在第4步之后),并得到:
然后我做了 OCR(通过 tesseract,tess4j):
并得到(足够好?)结果 - “Y841ox EH”(几乎是真的)
第 4 步后如何检测和裁剪板块区域?我是否需要分 1-4 个步骤进行一些更改(改进)?希望看到一些通过 Java + OpenCV(不是 JavaCV)实现的示例。
提前致谢。
编辑(感谢@Abdul Fatir 的回答)好吧,我为那些对这个问题感兴趣的人提供了工作(至少对我来说)代码示例(Netbeans+Java+OpenCV+Tess4j)。代码不是最好的,但我只是为了学习而写的。
http://pastebin.com/H46wuXWn(不要忘记将tessdata文件夹放入您的项目文件夹中)
java - 在 web 项目 java 中使用 Tesseract
我将 tess4j 用于 OCR。基本上 Tesseract 是用 C++ 开发的。当我在 java 的 Web 项目中使用它时,它会给出错误,因为它需要 dll 文件,因为 tess4j 使用 JNI。所以我想问一下我们可以在 web 项目中使用 Tess4j 吗?如果是,那么如何?如果不是,那么替代方案?
java - 运行tess4j项目突然出错?
我指的是项目“ https://github.com/mnadeem/ocr-tess4j-example ”,刚开始正常运行,突然报错不知道怎么解决?我尝试修改eclipse jvm内存,但是好像没有效果:(,还是项目本身不稳定?