我最近在 coursera 上学习了机器学习课程,并以不错的成绩通过了这门课程。我在课程中使用了 KNN、Logistic Regression、NN 等算法,其中一项任务是编写我能够完成的数字识别学习算法。课程以 Photo OCR 的案例研究结束,这让我非常兴奋,但我发现很难将课程中教授的基本算法应用到这个巨大的问题上。所以有人可以建议我一些关于 Photo OCR 的算法吗?
问问题
4489 次
1 回答
3
图像识别的问题在于它对任何变化都非常敏感。他们平均人脑能够从图像中提取某些特征,即使已经应用了某些图像操作(例如倾斜、旋转等),我们也可以识别给定的图像。
话虽这么说,据我所知,人工神经网络是使用最广泛的(投入一两个隐藏层通常也有帮助)。我听说过的另一种技术是 Wisard(或向导),但我找不到任何关于它的信息。这种技术基本上将图像分成多个部分,然后在将图像片段与您的知识库中的内容进行比较时,您可以获得一定百分比的相似性。
话虽这么说,如果我在你那里我会坚持使用神经网络加上一个像样的图形操作库,如 OpenCV(有各种包装器,包括 Java 和 C#)。目的是尽可能多地消除不需要的信息。例如,在某些情况下,将图像缩小为灰度或严格的黑白像素会有所帮助。
于 2012-08-31T09:23:08.820 回答