4

我正在开发 Objective-C 中的 OCR 应用程序。到目前为止,我的图像识别工作相当不错,但我有兴趣检测线条/行以获得可能更好更好的结果。

我的项目中有 tesseract 库和 leptonica 库。我查看了 tesseract 的 baseapi.h,我相信我正在寻找的是名为的函数

    Boxa* GetTextlines(Pixa** pixa, int** blockids);

我不确定如何在我的项目中使用此功能,或者它是否是我寻求的正确功能。任何人都可以就此事提供任何见解吗?

谢谢!

4

1 回答 1

0

检测页面元素(例如块、段落、行、单词等)的标准方法是使用 PageIterator 类。我不知道如何在 Objective-C 中做到这一点,但这里有一个 C++ 示例代码供参考:

tesseract::ResultIterator* ri = tess->GetIterator();
while (ri->Next(tesseract::RIL_LINE)) {
  // Do whatever you want with that line
  // Recognize line's text
  char* ctext = ri->GetUTF8Text(tesseract::RIL_LINE);
  // Get line's bounding box
  ri->BoundingBox(tesseract::RIL_WORD, &left, &top, &right, &bottom);
}
于 2013-06-05T13:58:40.973 回答