1

(我将在这里回答我自己的问题以获取一般知识)

在 Tesseract OCR 中,如何检测倒置的图像?
使用过 Tesseract 的人可能知道,也可能不知道 Tesseract可以读取倒置的图像。
然而,问题在于,如果您使用 hOCR 输出,您不知道它是颠倒的,因为文档中没有提到它。

那么如何检测呢?

4

1 回答 1

-1

仔细检查后,我注意到它确实不是直接在 hOCR 输出中,我希望在ocr_page div表示方向时有一些属性。

我所知道的是,您可以读取ocr_carea每页所有 s 的边界框的 y 值:

  • 如果值从低到高,则页面处于正常方向。
  • 如果值从高到低,则页面是颠倒的。

这对于 90 度和 270 度旋转可能有效,也可能无效,但很可能您会看到 x 值的类似模式。

于 2014-01-03T19:16:21.283 回答