3

我尝试通过 tesseract 执行此操作,但生成的 apk 文件为 8 mb。我在 Play 中看到过 Goggles 应用程序,它非常高效。我想知道如何整合该技术。我还没有在任何教程中看到过。如果有人知道该怎么做,请回复。

另外,如何提高我正在使用的 Tesseract 的质量。转换很顺利,但我想知道如果我将图像分成几个部分然后分别解析,那会有用吗?

要求是它应该阅读账单或收据,所以我想提高文本转换的质量。请建议。

4

1 回答 1

2

我相信你编译这个项目:tess-two。我对么?

如果是这样,您可以通过为特定的 CPU 架构编译不同的 APK 来大大减小 APK 的大小。此外,您可以删除 Leptonica 的大部分功能,因为您不需要它们。

为了获得更好的准确性:

  • 如果您使用手机的摄像头作为输入,则应更改二值化算法。Leptonica 有一些二值化算法,试试 Sauvola。
  • 调整 tesseract 的参数以获得更好的性能与速度。
  • 确保您在所有手机上都有一致的分辨率。大约300dpi左右。

如果您想要在大多数手机上快速运行的小型应用程序,请考虑在服务器上而不是手机上运行 OCR。

据我所知,Tesseract 是迄今为止可以为 Android 编译的最好的 OCR 引擎。它必须正确调整并提供良好的图像。

于 2013-04-15T11:52:51.660 回答