问题标签 [leptonica]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
790 浏览

makefile - 在没有 leptonica 的情况下构建 tesseract

我需要为某些工作(使用 emscripten 移植)构建没有 leptonica 依赖的 tesseract。我查看了 make 文件,似乎 tesseract 需要 leptonica 头文件和 lib 文件才能构建。

提供头文件不是问题,但由于某种原因我无法提供 lib 文件(emscripten 不会生成 leptonica 的 lib 文件)。我试图通过编辑make文件来阻止tesseract要求leptonica,但似乎我走错路了。

我对制作/自动工具的东西非常陌生,我所做的是从整个脚本中的$LIB“”变量中删除标志,ac_link并且在我认为它正在调用的更多地方。

但我猜这些构建系统可能有一种方法可以以更干净的方式删除依赖项,而无需编辑配置脚本中的任意位置(可能是 makefile.am 之类的一些地方,或其他地方)。或者有没有其他方法可以在没有 leptonica 的情况下构建 tesseract,我该怎么做?

抱歉,如果我使用了错误的术语,比如我说我对上述构建系统不太熟悉。

0 投票
0 回答
163 浏览

linux - liblept.so.4.0.3 中的错误 4:在 leptonica 1.72 安装

我在英特尔® Galileo 开发板上使用 Linux Yocto,并尝试安装 Leptonica,但当我键入时make check收到以下错误。

[20695.738252] lt-psioseg_reg [29506]:在 liblept.so.4.0.3 [b7590000+250000] 中 0 ip b7602f1c sp bf9754a0 错误 4 [b7590000+250000] 失败:psioseg_reg

似乎文件“liblept.so.4.0.3”中的错误我该如何解决这个问题?

0 投票
1 回答
1388 浏览

c++ - Tesseract-ocr,baseapi.h 致命错误:未找到 platform.h 文件

我正在从事车牌识别的工程工作,因此从一个简单的代码开始。也就是说,我下载了所有库或 OpenCV、Tesseract 和 Leptonica,但是当您尝试编译时,我遇到了位于库 Tesseract 中的文件 baseapi.h 的问题。

编译以下命令:g++ main.cpp -lopencv_core -lopencv_highgui -lopencv_imgproc -ltesseract

错误编译:tesseract-ocr/api/baseapi.h:27:22: 致命错误:platform.h: 没有这样的文件或目录

我的代码的开头:

...

0 投票
0 回答
1530 浏览

opencv - 计算机视觉:文档分析和文本检测方法 (OCR)

我正在寻找检测文档文本的技术。

例如,在普通的 .txt 文件上很容易:有许多用于图像处理的库、API 和 SDK,并且通常它们具有实现 OCR 算法的方法。

但是讨论“复杂”的印刷文件(文件的结构是众所周知的和确定性的),例如养老金计划年度报告的摘要页面:我只想提取“底线”数字。我知道顶部中心有标题,中间有一些表格,左下角有一些段落,右下角有我正在寻找的段落。

从文档中提取文本的方法是什么?这里的主要任务是分析文档结构与预定义结构的技术,当我们知道我们现在正在处理某些特定段落时 - 从这里开始很容易 - 应用上面提到的 OCR API 标准并收集您的数据自定义数据结构。

例如链接文档(第 1 页):每次我应用纯 OCR API 时,我都确切知道我在预定义模板的哪个部分工作的方法是什么?文档模板有:

顶部分为 3 个水平部分。

中间部分:标题,然后是第一个表,另一个标题,然后是另一个表。

底部:右上角的一些文字。

例子

谢谢,

0 投票
0 回答
403 浏览

ocr - 为 tesseract ocr 处理深色文本图像

我注意到,每当我为 tesseract 使用深色背景图像时,我都会遇到分段错误。我试图使用此代码提取符号

具体在代码中

那么有什么办法可以解决这个问题呢?我们应该用更暗的图像进行训练吗?

编辑:示例图像在此处输入图像描述

0 投票
0 回答
1220 浏览

tesseract - 如何调整 Tesseract 项目以静态链接到 Leptonica

我目前正在尝试使现有项目静态链接到其主要依赖项,以减少生成的输出库的大小。我要更改的项目是 Tesseract OCR,它依赖于 Leptonica 图像处理库。

目前,Leptonica 统计了 2481 个函数,但 Tesseract 只使用了其中的 163 个。换句话说,Tesseract 中仅使用了 6.6% 的 Leptonica 功能,但整个代码(3.5 MB + 附加库)将被加载并保存在内存中。对于桌面系统来说,这可能根本不是问题。但是在内存有限的移动设备上,未使用的代码占用几 MB 的成本太高了。

我希望使用静态链接来减小这对 Tesseract+Leptonica 的整体大小。这两个项目都使用 autoconfig/automake/libtool 构建系统。

Leptonica 的构建生成静态和动态库。Tesseract 在其 configure.ac 中使用以下行来声明 Leptonica 依赖项:

因为上述行确实将 Leptonica 自动添加到 $LIBS,所以我将其更改如下:

当我运行 ./configure 和 make 时,一切正常,但 Tesseract 仍将动态链接到 Leptonica。

在检查相应的 make 日志时,我注意到 g++ 链接调用只是忽略了我的“-Bstatic”属性并链接到共享库 (liblept.so):

我已经查阅了 autotools 文档和其他几个项目,但找不到任何有用的东西。因此,我决定自己在这里问这个问题。

我错过了什么重要的东西吗?

非常感谢您的帮助!最好的问候马克斯

0 投票
1 回答
177 浏览

image-processing - 1 位形态学 Leptonica

我正在尝试了解 Leptonica 代码以执行 1 BIT Morphology(dilation anderosion) 。谁能详细说明以下几点。

  1. 膨胀可以如下实现:从清除的目标图像(所有 OFF 像素)开始。然后对源图像与目标图像进行一系列逻辑或运算,每次都有特定的移位,由称为结构元素 (Sel) 的模式确定。
  2. 在此之后,Leptonica 如何使用 rasterop 进行二元形态学。一个视觉示例将非常受欢迎。
0 投票
1 回答
243 浏览

build - Leptonica fails all regression tests

When I try installing building Leptonica 1.72 downloaded from their website: http://www.leptonica.com/download.html using the default installation route:

I got 64/67 tests failed. I looked into this problem and installed some missing dependencies and when I tried building and checking again, 68/68 tests failed this time. Has anyone had the same problem? Where should I look to find the problem?

0 投票
1 回答
1876 浏览

android - 如何将 Leptonica Pix 对象转换为 Android 的位图

我有一个 Leptonica Pix 对象返回

现在,我怎样才能将它转换为位图,以便我可以通过ImageView.

leptonica.android.Pixandroid.graphics.Bitmap;

我没有找到查看 API 文件的转换方法。

0 投票
1 回答
427 浏览

c++ - 在 Leptonica 中将 32bpp 图像转换为 8bpp

我最近开始使用 leptonica 图像处理 API。但是每个 API 函数似乎都在获取 8bpp 的输入图像,而我的图像是 32bpp(或者可能是其他任何图像)。那么 Leptonica 中是否有任何功能可以将我的图像从 32bpp 转换为 8bpp。我已经搜索过,但没有运气。是因为没有功能可以做到这一点,还是我们必须只提供 8bpp 图像来进一步处理它(例如二值化)?或者我们是否必须从任何其他 3rd 方工具转换图像,然后将其提供给 leptonica。

我是图像处理和 leptonica 的新手。提前感谢您的建议。