问题标签 [leptonica]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
211 浏览

tesseract - 如何使用 Tesseract ORC 检测简单文本?

我正在尝试使用https://github.com/tesseract-ocr/tesseract将带有数字的简单图像转换为文本。我使用 Leptonica 和图像处理所需的其他库从 github 编译了最新版本。

我的图像如下所示: 在此处输入图像描述

我正在尝试像这样转换它:/usr/local/bin/tesseract '/home/var/img2text/phone.png' out但不是像3m mam. 可能是什么问题呢?

0 投票
1 回答
532 浏览

c++ - 错误 tesseract qt

我有一个奇怪的错误。我想建立一个简单的例子。

。轮廓:

主.cpp:

错误:

.../liblept.a(zlibmem.o): undefined reference to symbol 'deflate' error added symbols: DSO missing from command line collect2: error: Ld returned 1 exit status

0 投票
1 回答
1293 浏览

c++ - Tesseract-OCR 在 x64 上使用 Visual Studio 2015 构建

我在网上搜索了在 x64 目标上为 Visual-Studio 2015 构建的 Tesseract-OCR 二进制文件,但我没有找到。

我在这里找到了 x64 目标上的 Visual Studio 2013 的二进制文件:https ://github.com/charlesw/tesseract/tree/master/src/lib/TesseractOcr/x64

有人知道我在哪里可以找到这些二进制文件吗?

0 投票
1 回答
10699 浏览

python - 如何在没有 Visual Studio 的情况下在 Windows 上安装 leptonica+tesseract 以在 Anaconda 中使用?

我想从图像中执行文本识别,我想使用 Python。我安装了蟒蛇。现在我想安装 Tesseract,但我还需要安装 Leptonica。我没有找到任何明确的说明如何在 Windows 中执行此操作。对于 Leptonica,我不想安装 Visual Studio。那么任何人都可以提供明确的说明如何在没有 Visual Studio 的情况下在 Windows 上安装 leptonica 和 tesseract 以在 anaconda 中使用?谢谢。

0 投票
2 回答
5628 浏览

c++ - x64 上的 Visual Studio 2015 和 tesseract 3.05

好吧,我真的需要帮助。我的问题是如何将 tesseract 3.05 和 leptonica 1.73 库添加到 Visual Studio 2015 x64(Windows 10)。

去年夏天,我设法用 Visual Studio 2013 和旧版本的 leptonica 和 tesseract 做到了这一点,因为它有点简单,而且所有包含和 lib 在那里我只需要提供路径并下载一些 dll。但现在我什至看不到我应该使用的正确包含和库。好吧,我不是这些事情的专业人士,所以请如果有人可以帮助我并给我一些步骤去做。

有些人发布此链接: https ://github.com/peirick/leptonica

但不知道如何使用它。

0 投票
1 回答
731 浏览

image-processing - 如何找到条码的旋转角度

我需要将下面的图像旋转回 0 度。
条码图像(+30度)

我尝试使用Leptonica图像处理库的 pixFindSkewAndDeskew 函数,但它返回输入图像的副本。我需要的输出图像可能看起来这样
旋转回 0 度

我的算法应该旋转任何方向的图像。

这个功能有什么限制

我必须为此功能提供什么样的输入图像,例如高分辨率图像等?我应该考虑哪些参数来获得歪斜图像?

0 投票
1 回答
155 浏览

c++ - Leptonica 与 Xcode 框架冲突

我正在尝试使用带有 Xcode 7 的 openFrameworks (0.9.0) 构建 OSX OCR C++ 应用程序。

OCR 库是需要 Leptonica 的 Tesseract,我已经通过 Homebrew 安装了这两个库。Tesseract 被编译并链接为静态库(.a 文件),并且 Leptonica 根据链接上的说明通过仅添加 allheaders.h 来添加到项目中。

问题是:在我添加 之后allheaders.h,Xcode 自动将一个参数匹配allheaders.h到另一个宏定义中FixMath.h,这是 OSX CarbonCore 框架中的一个文件。这会在编译过程中导致错误。

冲突中的线allheaders.h是:

LEPT_DLL extern NUMA * numaFindPeaks ( NUMA *nas, l_int32 nmax, l_float32 fract1, l_float32 fract2 );

冲突中的宏FixMath.h是:

#define fract1 ((Fract) 0x40000000L)

似乎编译器将宏引用为函数中参数的定义,但我不知道如何切断这种连接。任何人都可以就如何解决这个问题提出一些建议吗?

0 投票
1 回答
244 浏览

imagemagick - Ephesoft 无法学习或提取某些 tif 图像(不是所有图像)

我正在使用 Ephesoft 社区版 4.0.2.0 和 tif 图像(由 ephesoft 测试),ephesoft 可以从某些图像中分类或提取数据但从其他图像中他不能在文件日志中没有错误消息的问题,我现在不知道为什么。

当我单击学习文件时,HOCR 和 HTML 生成的文件是空的,没有数据,只有这样的元数据:

Application_Checklist_HOCR.xml :


但是对于 US-invoice_HOCR.xml ephesoft 可以学习,文件如下所示:

0 投票
3 回答
2063 浏览

algorithm - 如何确定图像是否需要旋转

我正在尝试找到一种方法来确定是否需要旋转图像才能使文本水平对齐。如果它确实需要旋转多少度?

我将图像发送到 tesseract 并且为了使 tesseract 有效,图像中的文本需要水平对齐。

我正在寻找一种方法来做到这一点,而不依赖于图像中的“方向”元数据。

我想到了以下方法来做到这一点:

  1. 将图像顺时针旋转 90 度四次,并将所有四张图像发送到 tesseract。这并不理想,因为需要将一张图像处理 4 次。
  2. 使用霍夫线变换来查看线条是垂直的还是水平的。如果它们是垂直的,则旋转图像。这样,图像仍然可能需要旋转 180 度。所以我不确定这会有多有效。

我想知道是否有其他方法可以使用 OpenCV、imageMagik 或任何其他图像处理技术来完成此任务。

0 投票
3 回答
650 浏览

python - 如何将文件作为流从 python 发送到 C 库

我正在尝试在 python 中使用 Leptonica (C 库)。该库有一个pixRead将图像文件的绝对路径作为参数的方法。目前我成功地从 python 调用它,如下所示:

但是,我想调用将pixReadStream 文件流作为输入参数的方法。在我的 python 程序中,我可以使用 OpenCV 以 numpy 数组的形式访问图像。

问题

有什么方法可以将我在 Python 程序中作为 numpy 数组的图像传递给pixReadStream将文件流作为输入参数的 leptopnica C 库中的方法?