machine-learning - 图像识别样本量，对于完全等效图片的对象是否需要更大的样本量？

Question

我目前有每个字母的列表，字母表中的大写字母。字体是恒定的，即我的输入将始终是相同的字体。

鉴于字体是恒定的，我真的需要多个字母还是可以每个使用 1 个字母来训练程序？如果每个字母都需要多张图片，我可以通过机器学习算法运行同一张图片并假装它是第二张图片吗？（请注意，由于字体相同，因此第二张图像将完全相同）。

“打印屏幕”然后一次捕获一个特定的字母需要做很多工作，所以我基本上想知道我是否可以复制并粘贴所有图像 50 次以使我的 52 个样本大小变成 2600 个样本大小。

我在 python 上使用 scikit-learn 并将测试各种监督学习算法来识别字母。

score 0 · Accepted Answer

OCR不仅要区分不同的字母，还要应对小旋转、平移或变形等问题。

一个有用的神经网络（OCR 的通用模型）需要针对包含这些转换的标记数据进行训练。您也许可以从每个字母一个图像开始，然后以编程方式以增量方式旋转和翻译它，以生成许多带标签的训练示例。

就此而言，对于“原始”示例，您当然可以使用所需字体渲染单个字母并将它们保存到文件中，而不是使用文字屏幕截图。

1 回答 1