0

首先,对不起我的英语。我有一个关于 tesseract 的问题。有没有一种方法可以识别图形或图片中的文本而无需清理要识别的图像?在我读到的内容中,首先清理图像,删除图形和照片,只留下文本。但是我希望用户上传到服务器和剪报你可以在没有人为干预的情况下识别这个新闻。这可能很棘手。但是,如果您知道我可以做的任何其他方式,他们将不胜感激。非常感谢

4

1 回答 1

0

不,你不能。

Tesseract 是为阅读文本而设计的。当您对包含文本和图像的主题执行 OCR 时,Tesseract 会吐出它在图像中找到的东西(乱码)。

不过,您可以检测图像区域并将其裁剪掉。我认为这将是一个更好的问题。

于 2011-06-06T23:26:41.190 回答