Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
(我将在这里回答我自己的问题以获取一般知识)
在 Tesseract OCR 中,如何检测倒置的图像? 使用过 Tesseract 的人可能知道,也可能不知道 Tesseract可以读取倒置的图像。 然而,问题在于,如果您使用 hOCR 输出,您不知道它是颠倒的,因为文档中没有提到它。
那么如何检测呢?
仔细检查后,我注意到它确实不是直接在 hOCR 输出中,我希望在ocr_page div表示方向时有一些属性。
ocr_page
div
我所知道的是,您可以读取ocr_carea每页所有 s 的边界框的 y 值:
ocr_carea
这对于 90 度和 270 度旋转可能有效,也可能无效,但很可能您会看到 x 值的类似模式。