algorithm - 机器学习中的照片 OCR 算法

Question

我最近在 coursera 上学习了机器学习课程，并以不错的成绩通过了这门课程。我在课程中使用了 KNN、Logistic Regression、NN 等算法，其中一项任务是编写我能够完成的数字识别学习算法。课程以 Photo OCR 的案例研究结束，这让我非常兴奋，但我发现很难将课程中教授的基本算法应用到这个巨大的问题上。所以有人可以建议我一些关于 Photo OCR 的算法吗？

score 3 · Accepted Answer

图像识别的问题在于它对任何变化都非常敏感。他们平均人脑能够从图像中提取某些特征，即使已经应用了某些图像操作（例如倾斜、旋转等），我们也可以识别给定的图像。

话虽这么说，据我所知，人工神经网络是使用最广泛的（投入一两个隐藏层通常也有帮助）。我听说过的另一种技术是 Wisard（或向导），但我找不到任何关于它的信息。这种技术基本上将图像分成多个部分，然后在将图像片段与您的知识库中的内容进行比较时，您可以获得一定百分比的相似性。

话虽这么说，如果我在你那里我会坚持使用神经网络加上一个像样的图形操作库，如 OpenCV（有各种包装器，包括 Java 和 C#）。目的是尽可能多地消除不需要的信息。例如，在某些情况下，将图像缩小为灰度或严格的黑白像素会有所帮助。

algorithm - 机器学习中的照片 OCR 算法

1 回答 1

Related

Reference