java - 如何在缓冲图像上定位文本

Question

我需要分析缓冲图像并定位某个单词或短语的 X 和 Y 坐标。我将如何做到这一点，应该从哪里开始。我查看了一些 OCR 库，但我尝试的那些仅提供文本而没有找到文本的位置。

如果您有任何建议，将不胜感激。

score 2 · Accepted Answer

您可以检查 hOCR 输出或Tesseract的 ResultIterator 对象以获得识别的单词坐标。查看 Tess4J 的测试用例，Tess4J是 Tesseract API 的 Java JNA 包装器，以 BufferedImage 为例。

1 回答 1