问题标签 [tesseract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
.net - tesseract-ocr 仅使用 ascii?
我一直在使用运行良好的 tesseract-ocr(在 .NET 中)。我提供给它的图像只有 ascii (A-z0-9)。有没有办法告诉它不要使用特殊字符?
python - 如何使用 python 或 WMI 设置 RAM 磁盘驱动器?
我的问题的背景与免费的 OCR 引擎 Tesseract 相关(1985-1995 年由 HP 提供,现在托管在 Google 中)。它特别需要一个输入文件和一个输出文件;该参数只接受文件名(不是流/二进制字符串),因此为了使用包装器 API,例如 pytesser 和/或 python-tesser.py,必须创建 OCR 临时文件。但是,我有很多图像需要 OCR;频繁的磁盘写入和删除是不可避免的(当然也会影响性能)。我能想到的唯一选择是更改包装类并将临时文件指向 RAM 磁盘,这会带来这个问题。
如果您有更好的解决方案,请告诉我。
非常感谢。
-M
iphone - 训练 tesseract 以与 iPhone 一起使用
我试图在我的 iPhone 应用程序中使用 tesseract-2.04 并且只想检测数字。我在这里做的是首先我使用这篇文章http://robertcarlsen.net/2009/07/15/cross-compiling-for-iphone-dev-884交叉编译 tesseract 以生成 lib 文件,然后使用演示在http://robertcarlsen.net/2010/01/12/ocr-for-iphone-source-1080申请,但结果远非现实。
我无法解决问题或如何训练 tesseract 以使其在实际使用中关闭。
请帮忙。
谢谢,
马杜普
iphone - 用于手机照片的 OCR
我正在考虑开发一个移动 OCR 应用程序来检测移动图片中的单词。目的如果只是检测图片中有哪些文字,布局并不重要。它也将用于非常短的文本。
我目前正在考虑使 tesseract 适应 iphone 和 android。
不知道有没有人有相关经验?有什么限制等等。
谢谢!
iphone - iPhone 上的 Tesseract 训练
我在我的一个应用程序中使用 Tesseract,但我无法获得完美的结果。当我在完美的屏幕截图上使用该库时,它会获取大部分文本,这很好。但是,例如,当我在照片上使用它时,它很难解决,有时它甚至不会返回任何东西。
我知道你可以训练 Tesseract,有没有好的训练教程或 iPhone 照片识别的东西?或者在处理之前我应该对源图像进行任何修改吗?
谢谢!
delphi - Delphi / Tesseract OCR:有人可以帮我让这个新的 DLL 在 Delphi 中工作吗?
Google 一直在开发这个很棒的开源 OCR 组件: http ://code.google.com/p/tesseract-ocr/
他们在 2010 年 10 月开始推出新版本(版本 3)。
但是这个新版本不再有一个可以工作的 C 包装器,这取决于 Delphi 社区中的某个人来让它在 Delphi 内部工作——我正在尝试这样做,因为我非常需要它而且没有其他人很着急去做,但我不知道当涉及到 DLL 并将 C 转换为 Delphi 时我在做什么。那是我可以使用你的帮助的地方。
我得到的线索是我需要 Dependency Walker 以某种方式防止“名称修改”(不知道这意味着什么)。实际的 DLL API 方法位于 C 文件中 - 并且您在 Dependency-Walker 中看到的 DLL 函数名称可能与 API 文件中的函数匹配。
这是您需要帮助的所有内容:您将需要一个包含 tessdll.dll 的文件夹,并且 leptonlib.dll 只需要在那里即可。您需要一个名为“tessdata”的子文件夹,该文件夹内将是您的“语言数据文件” - [查看网站上的下载页面]
这是 Windows 安装程序,您可以查看运行中的 DLL:[查看网站上的下载页面]
为了让这适用于 Delphi,您的可执行文件与 DLL 位于同一文件夹中。然后您需要知道在 DLL 中调用什么,为此您可以查看 C 源文件:[查看网站下载页面上的源文件]
感谢您的任何帮助。
fonts - 识别屏幕截图中字符的最佳方法?
你会推荐什么来识别屏幕截图中的所有字符?屏幕截图非常清晰(只有白色背景上的黑色文本),我也可以为文本选择任何标准字体(安装在 Windows 上)。我尝试了一些 OCR 方法(Tesseract 等),但它在识别某些字符时出错(这让我感到困惑,因为文本没有丝毫噪音,而且字体是一些最常见的字体 - Courier New、Fixedsys 等),我需要它是 100% 准确的。是否有一些库可用于此特定目的,一些模式识别或其他什么?或者我应该得到一些等宽字体的屏幕截图,并遍历图像,向右移动 +font_size 像素,然后将捕获的东西与字母的内存表示和相同大小的相同字体的数量进行比较?解决这个问题的最佳方法是什么?非常感谢您提前。
更新:我终于通过使用等宽字体(Courier New)以我正在截屏的确切大小训练 Tesseract 来获得 100% 的准确度。希望对将来的人有所帮助:)
c++ - Tesseract 或任何其他 OCR 库
我正在寻找如何在 C++ 中使用(和训练?)Tesseract 的解释/API 文档/示例,在 google Tesseract 页面上没有任何用处,但在网络上还没有找到。
任何有用的资源和经验都会受到欢迎,因为我不知道如何开始。
PS:
- 我愿意就其他图书馆提出建议。
- 只有免费的图书馆
iphone - 如何提高 tesseract 识别数字的结果
我正在开发可识别 ISBN 编号的 iPhone 应用程序(ISBN:978-83-7380-900-0)我为此使用了 tesseract,但它运行得不是很好。我可以看到其他应用程序,使用相同的引擎工作得更好。
限制我使用此配置行的字符: tess->SetVariable("tessedit_char_whitelist", "SN:0123456789X-"); 所以所有的“I”都被转换为“1”,而“B”被转换为8。使用它不会让那些字母出错,这对我来说并不重要。之后,我使用正则表达式查找已识别文本的正确部分。
我还裁剪了图像,因此 tesseract 仅识别图像的一部分,其中 isbn 可见(我将颜色矩形放在相机叠加层上,因此用户必须将代码放置在正确的位置)我还将图像的大小调整为 1000px 宽度(也尝试了其他尺寸)
当光线很好时它工作得很好,但是当光线不完美时很难正确识别。
isbn 数字的最后一位是控制和。
我该怎么做才能让它更好地工作?有没有办法说 tesserect 仅在给定的正则表达式中识别文本?也许我应该先对图像做点什么?
无法正确识别的示例图像:http:
//img412.imageshack.us/i/img0367si.jpg/
http://img264.imageshack.us/i/img0361d.jpg/
symbian - Maemo / Symbian 和外部库
我怎么知道是否可以编译外部库以在不同的平台上工作?例如,该库是tesseract-ocr
如果可能的话,我该怎么做?(基本上我想创建一个使用这个库的 Qt 应用程序)