Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
尝试实现一个 java 类来将 hOCR 输出从 Tesseract 转换为 JSON 格式的数据。目前,我们将 Abbey 用于我们的 OCR 服务,它们为 OCR 图像上的 Words 位置返回 JSON 格式的数据。但是 Tesseract 只返回 hOCR。所以需要转换 tesseracts 输出以匹配 Abbey 的输出。