问题标签 [leptonica]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
855 浏览

android - 孤立阿拉伯语的手写识别

我在 Android 操作系统中开发了一个应用程序,用于使用 Tesseract OCR 识别手写的孤立阿拉伯字符。我已经尝试过了,但在某些情况下,Tesseract 无法识别带有连接字符的手写孤立阿拉伯字符,所以我想问一下:

1.是否有任何字符识别器可以让我的应用程序更准确地识别连接字符?

2.我听说Leptonica作为Tesseract中图像处理的库,是否足以提高Tesseract中识别阿拉伯语的精度?或者是否有任何图像处理库可以使识别过程更准确?

0 投票
1 回答
108 浏览

image-processing - 下面这个表达式是什么意思?

此表达式取自 Leptonica(图像处理库)中的内置函数“l_setDataByte”。

这是链接:http ://tpgit.github.io/Leptonica/arrayaccess_8c_source.html (此处为第 260 行)

0 投票
1 回答
253 浏览

unicode - 教授 OCR 以了解 NSA 和 FISC 编辑

我正在维护来自外国情报监视法庭的经过大量编辑的文件的档案。

它们带有大段的文本,如下所示:

已编辑文本的屏幕截图

当 OCR 尝试使用它时,您会收到如下文本:

在 90 天内每天生成此数据。这样做的唯一目的

生产是为了获取外国情报信息以支持

个人授权调查以防止国际恐怖主义和

所以在 OCRed 版本中,有黑点的地方,只是缺少单词。有时,缺少的单词会创建一个语法正确的句子,但具有不同/奇怪的含义(如上)。其他时候,生成的句子没有意义,但无论哪种方式都是一个问题。如果 OCR 引擎可以为这些点返回 X 或像 ▮▮▮▮ 这样的 Unicode 方块,那就更好了。

我想要的结果是这样的:

在 90 天内每天生成此数据。这样做的唯一目的

生产是为了获取外国情报信息以支持XXXXXXXXXXXX

个人授权调查以防止国际恐怖主义和

我的问题是如何获得这些 X。有没有办法分析图像以识别黑点?有没有办法用 X 或更好的 unicode 字符替换它们?我愿意接受任何使这看起来正确的想法,但图像编辑对我来说不是一个强项,也不是深入 OCR 引擎。

0 投票
1 回答
601 浏览

c++ - gcc链接器在cygwin下找不到任何库交叉引用

我可以在 Cygwin 下成功编译两个项目(leptonica 和 tesseract)(使用提供的 configure+make)。

此外,我可以成功地将简单的“hello world”项目与 leptonica 库链接起来。

但是当我尝试将项目与 tesseract 链接时,会出现多个错误,如下所示:

等等。

看起来 tesseract 库没有正确链接到 leptonica 库。可能是对象名称装饰不同或什么的。

如何检查/修复?

0 投票
0 回答
818 浏览

python - python-tesseract 给出与命令行 tesseract 不同的结果

我正在使用 python-tesseract 包装器对图像进行 OCR。但是,对于某些图像,我得到的结果与命令行中的 tesseract 命令获取的结果不同。在命令行我做tesseract myimg.png myimg && more myimg.txt

但是,python tesseract wrapper 的结果是不同的。

我怀疑这是因为可能从包装器中找不到 liblept,因为此行结果为 False:

有时我在使用包装器时遇到这些错误,但我不是来自命令行 tesseract:

有谁知道不匹配的原因可能是什么?由于命令行 tesseract 工作正常,我如何告诉包装器找到 liblept,我假设它正在正确找到 tesseract

0 投票
1 回答
1682 浏览

c++ - Qt 和 tesseract

我想将 tesseract 与 qt 5 + mingw 一起使用。我从这里下载了 vc++ libs fir

在我的应用程序中,我做了:

但是这段代码给了我这样的错误:

我的 .pro 文件如下所示:

我花了很多时间试图链接这个,我做错了什么吗?

0 投票
1 回答
651 浏览

android - 从 Pix 转换为 Bitmap 是否会修改 pix

我有一个 Android AsyncTask,它使用 Leptonica 库的方法反复将 Pix 转换为位图。ReadFile.readBitmap(bitmap)我在完成任何图像处理操作并从中获取 Pix 对象后执行此转换。

我发现当我不将 Bitmap 转换为 Pix 时,使用 Tesseract 的 OCR 结果更好。但是,我没有在任何操作中将 Pix 转换为 Bitmap。典型的循环如下所示:

那么,如果我想在将位图显示为进度的同时保持 OCR 结果的质量,我该怎么办。

0 投票
1 回答
428 浏览

c - Leptonica 中的 Pix、struct Pix 或 PIX

我已经能够成功地将“Pix”类型与 Tesseract 一起使用(参见http://code.google.com/p/tesseract-ocr/wiki/APIExample),但只定义了“struct Pix”和“PIX”在 pix.h(Leptonica 库的)中。“Pix”(没有“struct”关键字)似乎没有定义,但它必须定义somehwere

在标题中搜索“Pix”会导致太多匹配项无法浏览以查找含义。有谁知道为什么“Pix”有效?

0 投票
1 回答
1183 浏览

image-segmentation - 使用 Leptonica 进行字符分割

我试图弄清楚如何使用 Leptonica 库提供的分段器进行文档分析。我一直在看pageseg.c,但我认为我并不完全理解它:(!

如果我拍摄图像并将其作为 PIX 数据类型加载,我是否调用 pixGetRegionsBinary() 来查找每个符号的位置?然后我是否使用文本块掩码分别提取每个符号?

如果我理解正确,我会有这样的代码:

现在是文本块中的所有字符还是我使用了错误的分割方法:)?另外我怎么知道文本块“数组”何时结束?

提前致谢!!

编辑 26/11/2013

对于任何感兴趣的人 - Leptonica Doxygen 文档 - 页面分割是整页分割的一个很好的例子!

0 投票
0 回答
462 浏览

qt - 使用 leptonica 与 qt 5.2.0 (vs2012) 问题

我正在尝试让 Leptonica 1.68 与 Qt 5.2.0 (vs2012) 静态库一起使用。所以我决定先试试静态库,我下载了以下包leptonica-1.68-win32-lib-include-dirs.zip

并将其包含在我的项目中,如下所示:

我还使用我自己使用 vc2012+cmake 构建的 opencv

Opencv 是用 /MTd 构建的,leptonica 也是用 /MTd 构建的(我假设它来自库名称“static-mtdll”)

我的 qt 是使用以下配置构建的:

当我尝试构建我的应用程序时,我得到

我尝试将 /NODEFAULTLIBRARY:MSVCRT.LIB 添加到我的专业文件中,但 LIBCMTD 错误仍然存​​在,并且我收到更多这样的警告:

如果我使用非静态 qt 版本和 opencv 非静态库动态构建该项目,一切正常。(我想那将是 /MD)。所以我假设 leptonica 是用 /MD 编译的,我需要用 /MTd (静态调试)重新编译它。请帮助,或者提供使用 vc2012 构建 leptonica 的常见问题解答或解决方案。