我想实现一个 OCR 系统。我需要我的程序在它选择识别的字母上不犯任何错误。如果它不能识别其中很多也没关系(即即使召回率低也可以实现高精度)。
有人可以帮我为此选择合适的 ML 算法吗?我一直在环顾四周,发现一些令人困惑的事情。例如,我发现关于 SVM 的说法自相矛盾。在scikits learn docs中,提到我们无法获得 SVM 的概率估计。然而,我发现另一个帖子说可以在 WEKA 中执行此操作。
无论如何,我正在寻找一种最适合此目的的机器学习算法。如果您也可以为该算法推荐一个库,那就太好了。我更喜欢基于 Python 的解决方案,但我也可以使用 Java。