问题标签 [tesseract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - Tesseract 和 Php ocr
我希望使用 Tesseract 将大量图像文件转换为文本。
我查看了他们的文档,但不知道这与 PHP 有什么关系,以及我的 php 脚本将如何与 tesseract ocr 交互。我已经看到其他问题表明 php exec() 可能是这种方式。
我已经下载并安装了 tesseract。使用安装了最新版本的 xampp 的 Windows 7。我有 php 的初级到中级知识。我缺少什么知识?
更新我现在可以在 powershell 和 cmd 中使用它
但是当我尝试像这样通过 exec 运行它时:
我从 Windows 弹出一个窗口,提示 tesseract.exe 已停止工作。如果它们对任何人都意味着什么,这里是错误详细信息。
python - 在 Python 应用程序中使用 Tesseract OCR 的性能问题
我最近整理了一个界面,用于扫描和上传可搜索文档到我们的文档管理系统 KnowledgeTree。对于这个过程的不同部分,我们可以使用大量单独的工具,但我想将所有内容组合到一个界面中,以使用户的操作变得简单。
这是平台:
这是基本过程:
它工作得很好,除了第 2 步在某些类型的文档上非常慢。它在基本的固定宽度文本报告中滚动,但会在其中添加一些徽标、线条和其他不可读的内容,有时它可能会在单个页面上花费几分钟。更不用说如果它试图重新定向它最多可以重复 4 次。相比之下,扫描仪附带的软件使用 ABBYY OCR,可以在不到一分钟的时间内处理 50 多页,几乎完美地处理了页面布局和文本方向(我意识到这就是 ABBYY 花钱的原因)。不幸的是,使用此扫描软件对用户来说更加复杂,并且仅涵盖步骤 1-3。
我的问题是我是否应该以不同的方式处理这个问题,也许通过将 OCR/上传与扫描界面完全分开,是否有任何 OCR 包或其他我忽略的解决方案可以集成到 Python 应用程序中。我正在调用外部应用程序来完成工作这一事实会导致性能问题吗?
无论我在这里做什么,重要的是我可以控制第 4 步,因为要求用户手动设置每个上传文档的类型和元数据可能是个问题。
.net - .Net 的 Tessnet2 - 在 tessocr.Init 调用时退出
我有一个在 Visual Studio 10、Windows Vista Home Premium 中运行的 .net 控制台应用程序。我正在尝试使 tessnet2 示例正常工作。这是我的代码:
应用程序在 tessocr.Init 调用时以代码 1 退出。
我已将所有 9 个 eng 语言文件放在应用程序的调试目录中。
不知道我还能做什么?
android - 通过android NDK编译tesseract
我正在尝试使用 android ndk r5 为 android 编译 tesseract,通过检查https://android.googlesource.com/platform/external/tesseract获得 tesseract 的代码,我无法编译 tesseract 并出现错误,
我的 android.mk 看起来像这样,libjpeg 包含在 LOCAL_STATIC_LIBRARIES 中
请帮助我为 android 构建 tesseract。
concurrency - Tesseract(OCR 引擎)是可重入的吗?
我在四核处理器上使用 Tesseract 进行 OCR。为了提高速度,我想一次阅读 4 个单词,使用 4 个线程。从多个线程同时调用 Tesseract 是否安全?
注意:每个线程将处理不同的非共享图像。
注意:由于速度原因,用锁守卫是不行的。
iphone - iPhone 上的数字识别是否可以实时进行?
我需要从 iPhone 上的相机图像中实时识别数字。我知道图像上的数字不会超过 5 位。
考虑到 iPhone 的计算规格,这个问题是否真的可以解决?有没有人有使用 Tesseract OCR 库的经验,你认为可以通过使用它来解决吗?
c# - Tesseract OCR 库 - 学习字体
好吧,我正在使用此 OCR 的已编译 .NET 版本,可以在 @ http://www.pixel-technology.com/freeware/tessnet2/找到
我有它的工作,但是这样做的目的是翻译车牌,遗憾的是引擎真的不能准确翻译一些字母,例如这是我扫描以确定字符问题的图像
结果:
12345B7B9U ABCDEFGHIJKLMNUPIJRSTUVHXYZ
因此,以下字符被错误地翻译:
1、O、Q、W
这似乎还不错,但是在我的车牌上,结果并不是那么好:
= H4 ODM
= LDH IFW
假测试
= NR4 y2k
正如您可能会说的那样,我已经尝试过降噪、增加对比度和移除不是绝对黑色的像素,但没有真正的改进。
显然你可以“学习”引擎的新字体,但我认为我需要为.NET重新编译库,而且这似乎是在我没有的 Linux 操作系统上执行的。
http://www.scribd.com/doc/16747664/Tesseract-Trainingfor-Khmer-LanguageFor-Posting
所以我不知道接下来要尝试什么,如果有人想尝试,我编写了一个纯粹用于测试目的的快速控制台应用程序。如果有人有任何想法/图形处理/图书馆想法,我会很高兴听到他们的声音。
ocr - 有没有办法用小字体改进 tesseract OCR?
我正在尝试通过 python-tesseract 使用 tesseract-OCR 来读取如下所示的低分辨率字体:
不幸的是,图像返回
我认为分辨率太低,这会导致问题。我尝试放大图像,并将其裁剪为单个字符,但这些都没有提供太大的改进。还有什么我应该考虑做的事情,最好是可以使用 Python Imaging Library 完成的事情?或者我应该放弃/训练 tesseract。
值得一提的是,PIL 具有以下内置过滤器:
BLUR、CONTOUR、DETAIL、EDGE_ENHANCE、
EDGE_ENHANCE_MORE、EMBOSS、FIND_EDGES、
SMOOTH、SMOOTH_MORE 和 SHARPEN
ocr - 当它们与字母混合时,如何使 tesseract 只识别数字?
我想用它tesseract
来识别数字。问题是我混合了数字和字母,当我使用SetVariable("tessedit_char_whitelist", "0123456789")
每个符号时,tesseract 返回错误的数字。
我可以设置一个阈值以tesseract
省略相似度低的符号吗?
注意:我设置tesseract
为只识别数字,因此 O 和 0 之间没有混淆。
ocr - 如何让 tesseract 在存在噪声的情况下给出相关结果?
我正在使用 tesseract 3.0.0,但遇到了以下问题:
当某些东西太小而无法识别时,它似乎与其他片段合并。结果没有返回任何相关内容。
下图显示了 3 个案例。只有带有虚线的矩形被传递给 tesseract。矩形上方是结果(V 上方 T 表示换行)。
最后一种情况是问题。在这种情况下有什么办法可以改善 tesseract 吗?