问题标签 [tesseract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tesseract - 有没有办法用tesseract识别图形或图片中的文本?
首先,对不起我的英语。我有一个关于 tesseract 的问题。有没有一种方法可以识别图形或图片中的文本而无需清理要识别的图像?在我读到的内容中,首先清理图像,删除图形和照片,只留下文本。但是我希望用户上传到服务器和剪报你可以在没有人为干预的情况下识别这个新闻。这可能很棘手。但是,如果您知道我可以做的任何其他方式,他们将不胜感激。非常感谢
android - 如何使用 Tesseract-android-Tools
我有 tesseract-android-tools 1.00,请帮助我使用接口 TessBaseAPI。
我只是想将一个 .jpg 图像传递给一个 android 应用程序,该应用程序有一些文本作为图像的一部分。然后通过这个tesseract引擎我想将这些文本提取成可编辑的格式..
请帮助在android中创建此应用程序...
groovy - 模糊字符串匹配
在一些图像上运行光学字符识别后,我得到了近似的文本。很多时候认可度不是很高。例如,实际文本“DATE”是“DHTE”或“0HTE”。基本上我需要识别和提取每一行中的数据,所以我不想要完美的识别,只需要识别日期线即可。我试图计算 Levenshtein 编辑距离,但不幸的是,这往往会为 DATE 和 TIME 提供相似的值。目前,我正在尝试探索是否可以使用正则表达式匹配数据模式。
是否有更好的匹配过程的方法/算法?好在我的套话量不是很大。
(我将 tesseract 用于 ocr 和 groovy/java 用于算法)
android - 我的 ANDROID 应用程序的 Tesseract OCR 执行过程
首先,我想提一下我的要求:
几个月以来,我一直在研究 ANDROID 应用程序。我需要 OCR(光学字符识别)代码才能通过 CYGWIN、JNI、NDK 将其链接到我的应用程序。我发现 TESSERACT OCR 是唯一可用的开源代码。我已经从以下链接下载了 Tesseract OCR-3.00 的代码:
http://code.google.com/p/tesseract-ocr/wiki/ReadMe
我按照下载文件中“安装”文件中提到的步骤成功编译了CYGWIN环境中的代码。最后生成所有的 MAKE 文件。为了在我的应用程序中使用此代码,我需要“.so”文件,该文件将通过 CYGWIN 生成。
现在,我面临的问题是:
我已按照以下链接中提到的步骤将完整的代码 Tesseract OCR 导入到 ECLIPSE 中的 Android 应用程序代码中:
http://mindtherobot.com/blog/452/android-beginners-ndk-setup-step-by-step/
我已经按照上面链接中提到的程序进行了操作。但是与上面链接中给出的示例相比,导入 TESSERACT OCR 的代码非常困难。在 OCR 的情况下,要创建“.so”的最后一步不起作用。错误如下图所示![在此处输入图像描述][1]
建议:请向我建议如何进行下一步的明确解释.. plz plz..有人,请花一些时间给出明确的解释..
感谢和问候
pdf - tesseract ocr 多页 pdf 挂起
我们正在使用 Tesseract 的 Java 库,称为 Tess4j 将 PDF 文件转换为文本。它适用于 Tiff 文件以及一页 PDF 文件。但是对于多页 PDF,它确实会生成输出文件,当涉及到最后一页时,控件似乎并没有回到调用 doOCR 调用的原始应用程序。它只是停留/挂在那里而不做任何事情。本地呼叫没有返回是否有问题。我不知道,
请尽快让我知道是否有解决此问题的方法。
问候
维什
android - 用于 Tesseract OCR 的“.SO”文件
我需要为我的 Android 应用程序使用 Tesseract OCR(光学字符识别)的“.so”文件。谁能解释我如何获取 Tesseract OCR 的“.so”文件?
我试图导入不起作用的完整项目。
c# - C# tesnet2 混合模式“找不到属性‘useLegacyV2RuntimeActivationPolicy’的架构信息。”
我得到:
当我尝试编译时
我从http://www.pixel-technology.com/freeware/tessnet2/加载了 tessnet2_32.dll(Tesseract .NET 包装器(v 2.04.0))
我的 app.conf
有谁知道这可能是什么原因?
iphone - iPhone 和/或 Android 上的 Ocropus 引擎
在 iOS 和/或 android 上运行 ocropus 的最佳方法是什么?
我有兴趣使用Ocropus将移动设备上的一些内容数字化。我对使用训练有素的“语言”模型对设备进行预测非常感兴趣。培训将离线和离线进行。我知道有些人已经在移动设备上运行了 tesserect,但我找不到太多关于使用 Ocropus 进行相同操作的信息。我非常感谢您的集体智慧,以避免浪费时间走错路。
使用脚本对算法进行原型制作会更容易,然后获取感兴趣的特定 c++ 代码并将其直接包含在我的应用程序中。还是最好编译为静态/动态库?
opencv - 训练 Tesseract 3 从燃气表的真实图像中识别数字
我正在尝试训练 tesseract 从燃气表的真实图像中识别数字。
我用于训练的图像是用相机拍摄的,因此存在很多问题:图像分辨率差、图像模糊、光线不足或由于过度曝光、反射、阴影等导致的低对比度......
为了训练,我创建了一个大图像,其中包含由燃气表图像捕获的一系列数字,我手动编辑了文件框以创建 .tr 文件。结果是只有更清晰和更清晰的图像的数字被识别,而模糊图像的数字未被 tesseract 捕获。
visual-studio - 使用 Tesseract OCR 的 C API 构建错误
使用有关使用 API的链接以及如何将图像数据转换为 Tesseract 可识别的格式的链接,我编写了以下代码并将目录添加到...tesseract/ccmain/
我的 Visual C++ 项目的包含目录中(已用于 OpenCV)。
..... [OpenCV 代码等]....
它编译时没有任何错误,但是当我尝试构建它时,每个与 Tesseract 相关的函数调用都会出现此错误:“未解析的外部符号 XXXXX。” 我在链接和包含 Tesseract 时是否犯了任何错误,它没有出现在编译时,而只出现在构建时?
任何帮助都会很棒。
编辑:这些是错误消息: