3

我使用 Google 的 Tesseract API 创建了一个用于识别文本的基本应用程序,并将其与我的相机应用程序集成。它工作正常,但唯一的问题是准确性,因为有时文本被识别为随机字符集,我猜准确性约为 50%。

此外,当它尝试扫描图像中的四个以上单词时,应用程序会崩溃。

String ocrText = baseApi.getUTF8Text();
baseApi.end();

baseApiTesseract API 类的对象在哪里。

我是否需要使用不同的数据结构来保存已识别的文本,或者是否有其他原因导致四个以上的单词无法识别?

4

1 回答 1

1

Tesseract API 类提供了一个isValidWord方法来检查字符串是否为有效单词。您可以使用它来检查识别的字符。这将提高输出的准确性。

我正在使用 Tess4j 进行开发,它是 tesseract-ocr 的 Java JNA 包装器,在检查后它给出了相当好的结果。

不准确的结果可能是由于文本大小,检查一下。它说“精度下降到 10pt x 300dpi 以下,迅速低于 8pt x 300dpi。”

此外,不能检测到超过 4 个单词取决于很多因素,测试图像的类型(具有多少特征)、图像的大小、平台等。

于 2012-07-12T14:02:14.407 回答