2

据说“4916 个正例训练样本经过手工挑选,对齐、归一化并缩放到 24x24 的基本分辨率。通过从 9500 张不包含人脸的图像中随机挑选子窗口来选择 10,000 个负例样本。” 在论文“Robust Real-Time Face Detection by Paul Viola & Michael Jones”中

我的问题是他们对手工挑选的对齐、标准化和缩放到 24x24 的基本分辨率意味着什么?

“手工挑选对齐”是否意味着他们有 4916 张不同面孔的 4916 张正面图像?“标准化”是否意味着 4916 张图像中的每一张都具有相同的特征[文件大小、文件类型、图片颜色(灰度/彩色)]?“缩放到 24x24 的基本分辨率”是否意味着 4916 个图像中的每一个都被重新调整为 24x24 像素?

谢谢你的时间!

4

1 回答 1

2

“手工挑选对齐”是否意味着他们有 4916 张不同面孔的 4916 张正面图像?

不一定是不同的——但是是的,他们给出了 4916 张不同的面孔照片。这些面孔是由“人类专家”手动发现的。

“标准化”是否意味着 4916 张图像中的每一张都具有相同的特征[文件大小、文件类型、图片颜色(灰度/彩色)]?

他们只使用了灰度像素,归一化意味着他们确保没有“黑色”和“白色”图片。如果图片很暗 - 它会自动变亮,如果不够暗 - 它会变暗。这可以通过自动组件轻松完成。

“缩放到 24x24 的基本分辨率”是否意味着 4916 个图像中的每一个都被重新调整为 24x24 像素?

Yes, they made sure each "face" is exactly 24x24 pixels by applying some processing on the picture.

于 2012-12-06T23:47:44.210 回答