ios - Tesseract 检测线

Question

我正在开发 Objective-C 中的 OCR 应用程序。到目前为止，我的图像识别工作相当不错，但我有兴趣检测线条/行以获得可能更好更好的结果。

我的项目中有 tesseract 库和 leptonica 库。我查看了 tesseract 的 baseapi.h，我相信我正在寻找的是名为的函数

    Boxa* GetTextlines(Pixa** pixa, int** blockids);

我不确定如何在我的项目中使用此功能，或者它是否是我寻求的正确功能。任何人都可以就此事提供任何见解吗？

谢谢！

score 0 · Accepted Answer

检测页面元素（例如块、段落、行、单词等）的标准方法是使用 PageIterator 类。我不知道如何在 Objective-C 中做到这一点，但这里有一个 C++ 示例代码供参考：

tesseract::ResultIterator* ri = tess->GetIterator();
while (ri->Next(tesseract::RIL_LINE)) {
  // Do whatever you want with that line
  // Recognize line's text
  char* ctext = ri->GetUTF8Text(tesseract::RIL_LINE);
  // Get line's bounding box
  ri->BoundingBox(tesseract::RIL_WORD, &left, &top, &right, &bottom);
}

ios - Tesseract 检测线

1 回答 1

Related

Reference