0

我目前有每个字母的列表,字母表中的大写字母。字体是恒定的,即我的输入将始终是相同的字体。

鉴于字体是恒定的,我真的需要多个字母还是可以每个使用 1 个字母来训练程序?如果每个字母都需要多张图片,我可以通过机器学习算法运行同一张图片并假装它是第二张图片吗?(请注意,由于字体相同,因此第二张图像将完全相同)。

“打印屏幕”然后一次捕获一个特定的字母需要做很多工作,所以我基本上想知道我是否可以复制并粘贴所有图像 50 次以使我的 52 个样本大小变成 2600 个样本大小。

我在 python 上使用 scikit-learn 并将测试各种监督学习算法来识别字母。

4

1 回答 1

0

OCR不仅要区分不同的字母,还要应对小旋转、平移或变形等问题。

一个有用的神经网络(OCR 的通用模型)需要针对包含这些转换的标记数据进行训练。您也许可以从每个字母一个图像开始,然后以编程方式以增量方式旋转和翻译它,以生成许多带标签的训练示例。

就此而言,对于“原始”示例,您当然可以使用所需字体渲染单个字母并将它们保存到文件中,而不是使用文字屏幕截图。

于 2013-07-28T18:19:58.337 回答