在 tesseract 中使用 GetHOCRText(0) 方法,我能够检索 html 中的文本,并在 webview 中呈现 html 时,我可以获得文本,但图像中文本的位置与输出不同。任何想法都非常有帮助。
tesseract->SetInputName("word");
tesseract->SetOutputName("xyz");
tesseract->Recognize(NULL);
char *utf8Text=tesseract->GetHOCRText(0);
并输出图像