3

我正在开发一个在 Android 上使用 OCR 的应用程序。tess-two 样本运行良好,我可以获得完整的 OCR 文本,但我想知道如何在 Tesseract 实际输出的框中获取单个单词。我可以使用 getWords().getBoxRects() 来获取边界框列表,似乎 getWords() 函数可以满足我的要求,但它返回一个 Pixa 对象,我不确定单词列表(无论单词包含在框中)将从中获得。

我正在寻找的输出是具有以下键值的映射:

词:边界框

任何提示都会很棒。

4

1 回答 1

1

您可以解析 hOCR 输出以获取单词及其坐标。请参阅在 android 中为 tesseract OCR 导出 HOCR 输出

或者使用ResultIteratorAPI,如果tess-two支持的话。

于 2014-03-12T23:58:25.383 回答