我需要从一些图像中读取文本,图像清晰且噪音非常低。所以我最初的想法是获取文本应该很容易。(我知道的很少)
我测试了一些python库但没有成功(pytesser),他们可能会得到 10% 的正确率。我求助于谷歌的 tesseract-occ,但它仍然远远不够好。
这是一个例子:
结果如下:
nemnamons
Ill
w_on
lhggerllo
' 59
' as
\M_P2ma\
vuu uu
Cafllode omer
Mom | Dyna
Mom | Dyna
lnggerllo
2vMnne= Tr2rspnn| Factory (Hexmy;
lalgeflll Uxzlconflg
w_o«
w_o«
cammem
我究竟做错了什么?还是 OCR 识别真的这么糟糕?