Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我需要分析缓冲图像并定位某个单词或短语的 X 和 Y 坐标。我将如何做到这一点,应该从哪里开始。我查看了一些 OCR 库,但我尝试的那些仅提供文本而没有找到文本的位置。
如果您有任何建议,将不胜感激。
您可以检查 hOCR 输出或Tesseract的 ResultIterator 对象以获得识别的单词坐标。查看 Tess4J 的测试用例,Tess4J是 Tesseract API 的 Java JNA 包装器,以 BufferedImage 为例。