我正在做手写字符识别执行后我得到这样的输出
我的目标是预测像 test 这样的输出图像文件的特征,我使用了这个 k-means文件
任何人请帮我预测输出图像的字符。这将帮助我在我的项目中继续执行进一步的步骤,谢谢。
执行 OCR 需要对 k-means 进行操作的现有字母的相当大的训练集。在此应用中使用 k-means 将涉及对图像本身进行聚类(单个图像将是单个数据点),而不仅仅是对给定图像的像素进行聚类。一个好的起点可能是用于数字识别的MNIST 数据集。
此外,k-means 是一种无监督学习算法,可能不会为 OCR 提供很好的结果。它创建的类可能会将相似的字母混合a
在一起o
,为用不同风格书写的同一个字母创建多个类,并完全忽略其他字母。
您应该考虑使用一种监督算法,其中训练数据被标记,如 k-最近邻。这样,您将提前知道课程是什么,并在测试阶段取得更好的成功。