Tesseract setVariable 白名单适用于英语,例如我用它来识别图像中的数字和字母(不包括特殊字符 &*^%!等)
myOCR->SetVariable("tessedit_char_whitelist",
"0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ");
但我不能对俄语做同样的事情
myOCR->SetVariable("tessedit_char_whitelist", "0123456789абвгдежзийклмнопрстуфхцчшщъыьэюяАБВГДЕЖЗИЙКЛМОПРСТУФХЦЧШЩЭЮЯ");
有不同的原理吗?因为这是行不通的。我在输出中只收到数字,而不是所有确定的字符,tesseract 忽略了我放入白名单的所有俄语字母。黑名单也没有用。有没有办法摆脱它?谢谢。