“leptonica”的相关标签问题

0 投票

0 回答

855 浏览

android - 孤立阿拉伯语的手写识别

我在 Android 操作系统中开发了一个应用程序，用于使用 Tesseract OCR 识别手写的孤立阿拉伯字符。我已经尝试过了，但在某些情况下，Tesseract 无法识别带有连接字符的手写孤立阿拉伯字符，所以我想问一下：

1.是否有任何字符识别器可以让我的应用程序更准确地识别连接字符？

2.我听说Leptonica作为Tesseract中图像处理的库，是否足以提高Tesseract中识别阿拉伯语的精度？或者是否有任何图像处理库可以使识别过程更准确？

2013-04-11T16:13:29.617

0 投票

1 回答

108 浏览

image-processing - 下面这个表达式是什么意思？

此表达式取自 Leptonica（图像处理库）中的内置函数“l_setDataByte”。

这是链接：http ://tpgit.github.io/Leptonica/arrayaccess_8c_source.html （此处为第 260 行）

image-processing bitwise-operators xor typecast-operator leptonica

2013-08-01T15:35:17.970

0 投票

1 回答

253 浏览

unicode - 教授 OCR 以了解 NSA 和 FISC 编辑

我正在维护来自外国情报监视法庭的经过大量编辑的文件的档案。

它们带有大段的文本，如下所示：

已编辑文本的屏幕截图

当 OCR 尝试使用它时，您会收到如下文本：

在 90 天内每天生成此数据。这样做的唯一目的

生产是为了获取外国情报信息以支持

个人授权调查以防止国际恐怖主义和

所以在 OCRed 版本中，有黑点的地方，只是缺少单词。有时，缺少的单词会创建一个语法正确的句子，但具有不同/奇怪的含义（如上）。其他时候，生成的句子没有意义，但无论哪种方式都是一个问题。如果 OCR 引擎可以为这些点返回 X 或像 ▮▮▮▮ 这样的 Unicode 方块，那就更好了。

我想要的结果是这样的：

在 90 天内每天生成此数据。这样做的唯一目的

生产是为了获取外国情报信息以支持XXXXXXXXXXXX

个人授权调查以防止国际恐怖主义和

我的问题是如何获得这些 X。有没有办法分析图像以识别黑点？有没有办法用 X 或更好的 unicode 字符替换它们？我愿意接受任何使这看起来正确的想法，但图像编辑对我来说不是一个强项，也不是深入 OCR 引擎。

unicode imagemagick ocr tesseract leptonica

2013-09-17T22:29:54.567

0 投票

1 回答

601 浏览

c++ - gcc链接器在cygwin下找不到任何库交叉引用

我可以在 Cygwin 下成功编译两个项目（leptonica 和 tesseract）（使用提供的 configure+make）。

此外，我可以成功地将简单的“hello world”项目与 leptonica 库链接起来。

但是当我尝试将项目与 tesseract 链接时，会出现多个错误，如下所示：

等等。

看起来 tesseract 库没有正确链接到 leptonica 库。可能是对象名称装饰不同或什么的。

如何检查/修复？

c++gcc cygwin tesseract leptonica

2013-10-03T04:19:17.170

0 投票

0 回答

818 浏览

python - python-tesseract 给出与命令行 tesseract 不同的结果

我正在使用 python-tesseract 包装器对图像进行 OCR。但是，对于某些图像，我得到的结果与命令行中的 tesseract 命令获取的结果不同。在命令行我做tesseract myimg.png myimg && more myimg.txt

但是，python tesseract wrapper 的结果是不同的。

我怀疑这是因为可能从包装器中找不到 liblept，因为此行结果为 False：

有时我在使用包装器时遇到这些错误，但我不是来自命令行 tesseract：

有谁知道不匹配的原因可能是什么？由于命令行 tesseract 工作正常，我如何告诉包装器找到 liblept，我假设它正在正确找到 tesseract

python tesseract leptonica

2013-10-13T20:36:45.793

0 投票

1 回答

1682 浏览

c++ - Qt 和 tesseract

我想将 tesseract 与 qt 5 + mingw 一起使用。我从这里下载了 vc++ libs fir

在我的应用程序中，我做了：

但是这段代码给了我这样的错误：

我的 .pro 文件如下所示：

我花了很多时间试图链接这个，我做错了什么吗？

c++qt tesseract leptonica

2013-10-19T16:06:05.760

0 投票

1 回答

651 浏览

android - 从 Pix 转换为 Bitmap 是否会修改 pix

我有一个 Android AsyncTask，它使用 Leptonica 库的方法反复将 Pix 转换为位图。ReadFile.readBitmap(bitmap)我在完成任何图像处理操作并从中获取 Pix 对象后执行此转换。

我发现当我不将 Bitmap 转换为 Pix 时，使用 Tesseract 的 OCR 结果更好。但是，我没有在任何操作中将 Pix 转换为 Bitmap。典型的循环如下所示：

那么，如果我想在将位图显示为进度的同时保持 OCR 结果的质量，我该怎么办。

android bitmap leptonica

2013-11-11T10:11:47.177

0 投票

1 回答

428 浏览

c - Leptonica 中的 Pix、struct Pix 或 PIX

我已经能够成功地将“Pix”类型与 Tesseract 一起使用（参见http://code.google.com/p/tesseract-ocr/wiki/APIExample），但只定义了“struct Pix”和“PIX”在 pix.h（Leptonica 库的）中。“Pix”（没有“struct”关键字）似乎没有定义，但它必须定义somehwere。

在标题中搜索“Pix”会导致太多匹配项无法浏览以查找含义。有谁知道为什么“Pix”有效？

c tesseract leptonica

2013-11-13T05:33:25.193

0 投票

1 回答

1183 浏览

image-segmentation - 使用 Leptonica 进行字符分割

我试图弄清楚如何使用 Leptonica 库提供的分段器进行文档分析。我一直在看pageseg.c，但我认为我并不完全理解它:(！

如果我拍摄图像并将其作为 PIX 数据类型加载，我是否调用 pixGetRegionsBinary() 来查找每个符号的位置？然后我是否使用文本块掩码分别提取每个符号？

如果我理解正确，我会有这样的代码：

现在是文本块中的所有字符还是我使用了错误的分割方法:)？另外我怎么知道文本块“数组”何时结束？

提前致谢！！

编辑 26/11/2013

对于任何感兴趣的人 - Leptonica Doxygen 文档 - 页面分割是整页分割的一个很好的例子！

image-segmentation leptonica

2013-11-25T14:01:29.740

0 投票

0 回答

462 浏览

qt - 使用 leptonica 与 qt 5.2.0 (vs2012) 问题

我正在尝试让 Leptonica 1.68 与 Qt 5.2.0 (vs2012) 静态库一起使用。所以我决定先试试静态库，我下载了以下包leptonica-1.68-win32-lib-include-dirs.zip

并将其包含在我的项目中，如下所示：

我还使用我自己使用 vc2012+cmake 构建的 opencv

Opencv 是用 /MTd 构建的，leptonica 也是用 /MTd 构建的（我假设它来自库名称“static-mtdll”）

我的 qt 是使用以下配置构建的：

当我尝试构建我的应用程序时，我得到

我尝试将 /NODEFAULTLIBRARY:MSVCRT.LIB 添加到我的专业文件中，但 LIBCMTD 错误仍然存在，并且我收到更多这样的警告：

如果我使用非静态 qt 版本和 opencv 非静态库动态构建该项目，一切正常。（我想那将是 /MD）。所以我假设 leptonica 是用 /MD 编译的，我需要用 /MTd （静态调试）重新编译它。请帮助，或者提供使用 vc2012 构建 leptonica 的常见问题解答或解决方案。

qt opencv visual-studio-2012 static-libraries leptonica

2013-12-30T18:41:10.053

问题标签 [leptonica]

Reference