0

我需要分析缓冲图像并定位某个单词或短语的 X 和 Y 坐标。我将如何做到这一点,应该从哪里开始。我查看了一些 OCR 库,但我尝试的那些仅提供文本而没有找到文本的位置。

如果您有任何建议,将不胜感激。

4

1 回答 1

2

您可以检查 hOCR 输出或Tesseract的 ResultIterator 对象以获得识别的单词坐标。查看 Tess4J 的测试用例,Tess4J是 Tesseract API 的 Java JNA 包装器,以 BufferedImage 为例。

于 2013-04-30T23:56:15.010 回答