我最近按照一些教程来设置 Tesseract,现在我正在尝试查看 OCR 是否正常工作。当我拍照并获取文本时,有时会收到非英文字符。它实际上看起来像胡言乱语。我在下面发布了一个输出示例:
; .'—--~_~:~ ear
.::§—‘.::~__>‘Z~r'.‘ ,::-SES‘:3£a"3'§_“5.E.~ °?®.=_-
.—_;%~‘=*c§u-5; H =—oc+-»o cn-5 '55:.
我拍的照片是此链接中研究文章的第一页。我不确定为什么会这样。我在 tessdata 子目录中也有 eng.traineddata 文件。