0

我正在尝试实现 Tesseract 库以从图像中获取文本,它在某些情况下有效,但在大多数情况下它会失败。

我在我的 Android 项目中使用这个库:https ://github.com/rmtheis/tess-two

我正在尝试使用此图像

在此处输入图像描述

实际结果

在此处输入图像描述

预期结果

维基百科

免费的百科全书

关于为什么它不起作用的任何建议?

4

1 回答 1

0

它不起作用,因为:

  • 图像中的光照不均匀
  • 捕获的图像顶部存在地球图形的一部分。

通过拍摄屏幕照片,您可以在捕获的图像上引入一些较暗的区域。要修复它,您可以直接使用图像而不是拍照,或者您可以在应用程序中添加代码来调整不均匀的照明。

使用不同的照明,并在文本区域周围裁剪,我得到了更好的结果:

OCR 结果显示正确识别

于 2014-06-08T18:04:40.067 回答