问题标签 [leptonica]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
381 浏览

android - 旋转 Leptonica Pix

我正在使用 tesseract-android-tools api。在调用 tesseract 以获得结果之前,我需要将图像旋转为像素。我尝试使用

保存旋转图像后,我可以看到只是内容已被旋转。请参阅添加图像。我所做的也是将 Rect 设置为正确的尺寸,但没有结果:

或创建具有正确尺寸的新 Pix,也没有结果:

任何想法如何在像素级别上正确旋转图像?

图片需要旋转

调用 Rotate.rotate(..) 后,只旋转内容

0 投票
3 回答
11849 浏览

ios - OCR:图像到文本?

在标记为复制或重复问题之前,请先阅读整个问题。

我现在能做的如下:

  1. 获取图像并裁剪 OCR 所需的部分。
  2. tesseract使用和处理图像leptonica
  3. 当应用的文档被裁剪成块,即每张图像 1 个字符时,它提供了 96% 的准确度。
  4. 如果我不这样做并且文档背景为白色而文本为黑色,则它提供几乎相同的准确性。

例如,如果输入是这张照片:

照片开始

在此处输入图像描述

照片结束

我想要的是能够在在此处输入图像描述
不生成块的情况下为这张照片获得相同的精度。

我用来初始化 tesseract 并从图像中提取文本的代码如下:

对于 tesseract 的初始化

在 .h 文件中

在 .m 文件中

从图像中获取文本

但是我没有得到正确的车牌图像输出,或者它是空的,或者它为图像提供了一些垃圾数据。

如果我使用第一个图像,即白色背景,文本为黑色,那么输出的准确率是 89% 到 95%。

请帮帮我。

任何建议将不胜感激。

更新

感谢@jcesar 提供链接,也感谢@konstantin pribluda 提供有价值的信息和指导。

我能够将图像转换为正确的黑白形式(几乎)。因此所有图像的识别效果都更好:)

需要帮助进行正确的图像二值化。任何想法将不胜感激

0 投票
1 回答
599 浏览

objective-c - 在 NSImage 和 Leptonica Pix 之间转换

我正在开发一个 Cocoa OS X 程序来清理扫描的页面,并希望使用Leptonica 的库来完成繁重的工作。我在这篇文章这个这个中找到了一些信息. 我当然可以从 NSImage 获得 CGImage 并且可以将数据写入 Leptonica Pix 图像。我遇到的问题是,我的图像有 75% 的时间出现扭曲,并带有理发店杆型图案(从图像顶部到底部的每一连续像素行都向右移动得越来越远)。有时虽然图片出来很好。我认为我在设置图像数据时做错了,但这并不是我的强项,所以我无法理解这个问题。我正在使用以下代码创建 Pix 图像:

pix 结构体定义如下:

0 投票
0 回答
431 浏览

android - 使用 Tesseract+Leptonica 检测 android 中的字体大小

我正在制作一个 android 应用程序来使用 Tessearact 和 Leptonica(用于二值化和 Otsu 阈值)库对文本执行 OCR。所以我的问题是:我可以检测或至少区分(更大/更小)应用程序读取的字体大小吗?

0 投票
1 回答
2559 浏览

android - Android Tesseract 和 Leptonica OCR。读取单个框和字符

我在 Android 上使用 Tesseract,我有以下代码来提取字符串和从图像中读取的框:

在这里我可以看到每个字符的文本和框,但有时文本的大小与框数组的大小不同,则无法设置读取字符的框。

有没有办法获得确切的盒子和它的字符?

0 投票
1 回答
2819 浏览

c# - Tesseract 是否需要一个库来检测 PNG 文件?

我正在运行 Tesseract 2.04 来读取 PNG 文件,但出现此错误:-

我到处搜索并尝试了几件事,但找不到根本原因。有些页面暗示安装一些 Leptonica 库,但没有具体说明。似乎每个人的 Tesseract 版本默认都可以读取 PNG 文件。我会错过什么?

谢谢!

0 投票
2 回答
1507 浏览

tesseract - 无法为 tesseract (mac os x) 创建训练数据

我正在尝试为 tesseract 的特定字体创建训练数据,但在以下命令中失败:

我在终端中得到以下输出。

我已经通过 MacPort 安装了 tesseract 和 leptonica。

以下是终端中 tesseract -v 命令的输出。

0 投票
4 回答
20017 浏览

java - 无法加载库“tesseract”:libtesseract.so:无法打开共享对象文件:没有这样的文件或目录

我已经在我的 MBP 上运行了一段时间的tesseract 和Tess4J 。今天我开始将我的应用程序迁移到服务器并开始在服务器上安装所有内容。在 tomcat 中运行 Tess4J 之前,我尝试运行一个简单的 java 程序以确保一切正常。它不是...

  • 我在 centOS 64 位服务器上
  • 我已经安装了 tesseract 并且它工作正常 -tesseract myimage.jpg mytext产生数据

但是,运行我使用 Tess4j 的简单类会产生此错误:

线程“主”java.lang.UnsatisfiedLinkError 中的异常:无法加载库“tesseract”:libtesseract.so:无法打开共享对象文件:没有这样的文件或目录

到目前为止我所做的

  • sudo ldconfig在安装 tesseract 后跑了
  • 我搜索了 libtesseract.so 并在/usr/local/lib/libtesseract.so

服务器上的文件夹包含以下文件:

tesseract -v 产生:

问题

如何让 Tess4J 知道 libtesseract.so 确实存在?enter code here

0 投票
1 回答
3032 浏览

ocr - 无法在 Tesseract 中制作 boxfile(或打开 tiff)

我正在按照这些说明为新字体训练 Tesseract OCR 引擎。

但是,在尝试制作 box 文件时,出现错误。这是我使用的命令:

这是错误消息:

一些谷歌搜索表明 Leptonica 安装可能存在错误。我什至不知道我的计算机上是否安装了 Leptonica,并且该网页与几个自述文件(一个称为“自述文件”和一个称为“文档”)相当混乱,它们都不够简单,我无法理解如何制作它在 Windows 上工作。我有 Visual Studio 2008 的 Express Edition,所以我不能使用建议的命令提示符。

所以,我的问题是:有谁知道可能出了什么问题以及我如何解决它?

0 投票
1 回答
1054 浏览

c++ - 如何在 Leptonica 的图像(PIX)中围绕矩形创建边框?

我有一个 PIX 格式的图像,我也有一个 BOX[带有必要的坐标],我想在框中的内容周围画一个边框,例如 -
例子

我查看了文档,但到目前为止,我只知道如何为整个图像设置边框,而不仅仅是其中的一个矩形。