问题标签 [tesseract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
multithreading - tesseract 3.00 是多线程的吗?
我阅读了其他一些帖子,建议他们将在 3.00 中添加多线程支持。但我不确定它是否在 3.00 发布时添加。
除了多线程之外,运行 tesseract 的多个进程是否是实现并发的可行选择?
谢谢。
image-processing - 使用 ImageMagick、OCR、JavaScript 将标记图像 (EPS) 转换为交互式网页
Business Insight: 我们处于教育领域,我们需要将标记图像(EPS) 自动转换为学生使用的交互式练习(使用 HTML/SVG/JavaScript)。
技术见解: 分层 EPS 文件是我们从出版商那里得到的。EPS 文件应转换为两个 PNG 文件:[1.png]只有标签文本[2.png]除标签文本外的所有其他文件。
然后[1.png]应该通过一些高级 OCR (?) 程序运行,该程序应该输出标签文本及其在图像中的位置(X,Y 坐标)。然后可以使用 HTML/JavaScript 将标签文本覆盖在[ 2.png] 上,以及使用 JavaScript 进行拖放等交互。
到目前为止尝试过: 手动将 EPS 转换为 PNG,并使用 ImageMagick 和 Tessaract OCR 单独获取标签文本。
问题: 图像处理的上述要求(EPS->PNG+带有坐标的文本标签)可以自动化到什么程度,可以使用哪些最佳工具?提前感谢帮助。
PS:我是一名 UI 开发人员,可以处理 HTML/JavaScript 部分,如果只为标签提供坐标。
c# - 从光标下的单词中获取图片进行 OCR 处理
嗨 Fox 我想检测光标下的单词并从中获取图像(如巴比伦)。但我不知道如何获取光标下抓取单词的屏幕区域。
谢谢你的帮助
tesseract - Tesseract 和 tiff 格式 - spp 不在集合 {1,3} 中
尝试运行此命令时:
我得到下一个错误
假设这spp not in set
是这里的主要错误,那是什么意思?起初它遇到了麻烦,因为 bpp 高于 24,所以我使用 Gimp 降低了它,但这并没有解决问题。
tesseract - mftraining阶段的Tesseract问题
在运行 unicharset_extractor 之后,我已经成功地创建了一个带有 tesseract 的盒子文件,
它创建了如下所示的 unicharset 文件:
我继续执行此命令
只是为了得到下一个错误
ocr - 我可以使用 OCR 检测字体样式(粗体、斜体)吗?
我对使用 OCR 从简单文本中提取粗体和斜体字感兴趣。例如,如果我输入带有如下文本的清晰图像:
“敏捷的棕狐跳过了懒惰的狗。”
我想得到这样的输出:bold("brown", "jumps"), italic("lazy")
我已经研究过用 OCRopus 或 Tesseract 来做这件事,但是文档很差,我不知道它是否可能,或者如果它是怎么做的。
android - 在 Android 中集成 Tesseract OCR 引擎
我们如何在我们的 Android 项目中使用 Tesseract OCR 引擎来读取图像中的字符..如何在 android 上安装它?请帮忙
c# - c# OCR 无法识别数字(tesseract 2)
它失败了,我得到一个〜作为回报。我正在使用谷歌的 tesseract 2,使用 C#(开源 c# 包装器),现在我想知道,这张图片是否太糟糕而不能用于 OCR?
因为恕我直言,数字很清楚。
您是否有任何其他 OCR 引擎可以解决这个问题?
编辑
我也尝试过使用Asprise OCR(http://asprise.com/product/ocr/selector.php),但它也无法解析图像......
ocr - Tesseract OCR 培训的替代方案?
在过去的 3 个月里,我一直在尝试训练 Tesseract
识别我拥有的一组图像,由于确实缺乏
适当的文档,并且非常复杂,我开始
放弃将 Tesseract 作为一个解决方案。
我正在寻找一种替代方法,它对训练来说相对无痛
,我不想在这里重新发现轮子。
如果没有任何免费的东西,我想付费解决方案将
不得不做(不超过 200 美元)
vb.net - 在 VB.net 中使用 Tesseract 时出现奇怪的错误
我有当前的代码:
我只有一个普通的 RichTextBox 和表单上的一个按钮。我在调试目录中也有一个名为“image.png”的图像。
每次我运行它时,程序都会关闭。我做了一步,突然出现一个文件定位器,询问“tessnet2.cpp”
我有对 dll 的引用。我也不知道 ocr.Init(...) 行的用途。
你能帮忙的话,我会很高兴!