据说“4916 个正例训练样本经过手工挑选,对齐、归一化并缩放到 24x24 的基本分辨率。通过从 9500 张不包含人脸的图像中随机挑选子窗口来选择 10,000 个负例样本。” 在论文“Robust Real-Time Face Detection by Paul Viola & Michael Jones”中
我的问题是他们对手工挑选的对齐、标准化和缩放到 24x24 的基本分辨率意味着什么?
“手工挑选对齐”是否意味着他们有 4916 张不同面孔的 4916 张正面图像?“标准化”是否意味着 4916 张图像中的每一张都具有相同的特征[文件大小、文件类型、图片颜色(灰度/彩色)]?“缩放到 24x24 的基本分辨率”是否意味着 4916 个图像中的每一个都被重新调整为 24x24 像素?
谢谢你的时间!