问题标签 [leptonica]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tesseract - 如何使用 Tesseract ORC 检测简单文本?
我正在尝试使用https://github.com/tesseract-ocr/tesseract将带有数字的简单图像转换为文本。我使用 Leptonica 和图像处理所需的其他库从 github 编译了最新版本。
我正在尝试像这样转换它:/usr/local/bin/tesseract '/home/var/img2text/phone.png' out
但不是像3m mam
. 可能是什么问题呢?
c++ - 错误 tesseract qt
我有一个奇怪的错误。我想建立一个简单的例子。
。轮廓:
主.cpp:
错误:
.../liblept.a(zlibmem.o): undefined reference to symbol 'deflate' error added symbols: DSO missing from command line collect2: error: Ld returned 1 exit status
c++ - Tesseract-OCR 在 x64 上使用 Visual Studio 2015 构建
我在网上搜索了在 x64 目标上为 Visual-Studio 2015 构建的 Tesseract-OCR 二进制文件,但我没有找到。
我在这里找到了 x64 目标上的 Visual Studio 2013 的二进制文件:https ://github.com/charlesw/tesseract/tree/master/src/lib/TesseractOcr/x64
有人知道我在哪里可以找到这些二进制文件吗?
python - 如何在没有 Visual Studio 的情况下在 Windows 上安装 leptonica+tesseract 以在 Anaconda 中使用?
我想从图像中执行文本识别,我想使用 Python。我安装了蟒蛇。现在我想安装 Tesseract,但我还需要安装 Leptonica。我没有找到任何明确的说明如何在 Windows 中执行此操作。对于 Leptonica,我不想安装 Visual Studio。那么任何人都可以提供明确的说明如何在没有 Visual Studio 的情况下在 Windows 上安装 leptonica 和 tesseract 以在 anaconda 中使用?谢谢。
c++ - x64 上的 Visual Studio 2015 和 tesseract 3.05
好吧,我真的需要帮助。我的问题是如何将 tesseract 3.05 和 leptonica 1.73 库添加到 Visual Studio 2015 x64(Windows 10)。
去年夏天,我设法用 Visual Studio 2013 和旧版本的 leptonica 和 tesseract 做到了这一点,因为它有点简单,而且所有包含和 lib 在那里我只需要提供路径并下载一些 dll。但现在我什至看不到我应该使用的正确包含和库。好吧,我不是这些事情的专业人士,所以请如果有人可以帮助我并给我一些步骤去做。
有些人发布此链接: https ://github.com/peirick/leptonica
但不知道如何使用它。
c++ - Leptonica 与 Xcode 框架冲突
我正在尝试使用带有 Xcode 7 的 openFrameworks (0.9.0) 构建 OSX OCR C++ 应用程序。
OCR 库是需要 Leptonica 的 Tesseract,我已经通过 Homebrew 安装了这两个库。Tesseract 被编译并链接为静态库(.a 文件),并且 Leptonica 根据此链接上的说明通过仅添加 allheaders.h 来添加到项目中。
问题是:在我添加 之后allheaders.h
,Xcode 自动将一个参数匹配allheaders.h
到另一个宏定义中FixMath.h
,这是 OSX CarbonCore 框架中的一个文件。这会在编译过程中导致错误。
冲突中的线allheaders.h
是:
LEPT_DLL extern NUMA * numaFindPeaks ( NUMA *nas, l_int32 nmax, l_float32 fract1, l_float32 fract2 );
冲突中的宏FixMath.h
是:
#define fract1 ((Fract) 0x40000000L)
似乎编译器将宏引用为函数中参数的定义,但我不知道如何切断这种连接。任何人都可以就如何解决这个问题提出一些建议吗?
imagemagick - Ephesoft 无法学习或提取某些 tif 图像(不是所有图像)
我正在使用 Ephesoft 社区版 4.0.2.0 和 tif 图像(由 ephesoft 测试),ephesoft 可以从某些图像中分类或提取数据但从其他图像中他不能在文件日志中没有错误消息的问题,我现在不知道为什么。
当我单击学习文件时,HOCR 和 HTML 生成的文件是空的,没有数据,只有这样的元数据:
Application_Checklist_HOCR.xml :
但是对于 US-invoice_HOCR.xml ephesoft 可以学习,文件如下所示:
algorithm - 如何确定图像是否需要旋转
我正在尝试找到一种方法来确定是否需要旋转图像才能使文本水平对齐。如果它确实需要旋转多少度?
我将图像发送到 tesseract 并且为了使 tesseract 有效,图像中的文本需要水平对齐。
我正在寻找一种方法来做到这一点,而不依赖于图像中的“方向”元数据。
我想到了以下方法来做到这一点:
- 将图像顺时针旋转 90 度四次,并将所有四张图像发送到 tesseract。这并不理想,因为需要将一张图像处理 4 次。
- 使用霍夫线变换来查看线条是垂直的还是水平的。如果它们是垂直的,则旋转图像。这样,图像仍然可能需要旋转 180 度。所以我不确定这会有多有效。
我想知道是否有其他方法可以使用 OpenCV、imageMagik 或任何其他图像处理技术来完成此任务。
python - 如何将文件作为流从 python 发送到 C 库
我正在尝试在 python 中使用 Leptonica (C 库)。该库有一个pixRead
将图像文件的绝对路径作为参数的方法。目前我成功地从 python 调用它,如下所示:
但是,我想调用将pixReadStream
文件流作为输入参数的方法。在我的 python 程序中,我可以使用 OpenCV 以 numpy 数组的形式访问图像。
问题
有什么方法可以将我在 Python 程序中作为 numpy 数组的图像传递给pixReadStream
将文件流作为输入参数的 leptopnica C 库中的方法?