作为离线手写识别程序的一部分,我有一大堆手写数字,由大约 100 人写的数字 0 到 9。在让程序对每个图像进行分类之前,我想做一些预处理以以更标准的形式获得它们。
所有图像目前都是由 1 和 0 组成的 64x64 网格(0 表示白色,1 表示黑色),但由于手写风格的差异,有些数字比其他数字大,有些位置不同,有些有奇怪的倾斜(就像人们把它们画成对角线一样)
我已经大致想出了如何将它们全部移动到同一个中心并使它们大致相同的大小,并且我知道要纠正歪斜/倾斜,我需要将它们旋转一定量。问题是:我怎么知道旋转图像的数量?是否有一些标准算法可以指出我们的资源来解决这个问题?