algorithm - 中提琴琼斯实验（训练集）

Question

据说“4916 个正例训练样本经过手工挑选，对齐、归一化并缩放到 24x24 的基本分辨率。通过从 9500 张不包含人脸的图像中随机挑选子窗口来选择 10,000 个负例样本。” 在论文“Robust Real-Time Face Detection by Paul Viola & Michael Jones”中

我的问题是他们对手工挑选的对齐、标准化和缩放到 24x24 的基本分辨率意味着什么？

“手工挑选对齐”是否意味着他们有 4916 张不同面孔的 4916 张正面图像？“标准化”是否意味着 4916 张图像中的每一张都具有相同的特征[文件大小、文件类型、图片颜色（灰度/彩色）]？“缩放到 24x24 的基本分辨率”是否意味着 4916 个图像中的每一个都被重新调整为 24x24 像素？

谢谢你的时间！

score 2 · Accepted Answer

“手工挑选对齐”是否意味着他们有 4916 张不同面孔的 4916 张正面图像？

不一定是不同的——但是是的，他们给出了 4916 张不同的面孔照片。这些面孔是由“人类专家”手动发现的。

“标准化”是否意味着 4916 张图像中的每一张都具有相同的特征[文件大小、文件类型、图片颜色（灰度/彩色）]？

他们只使用了灰度像素，归一化意味着他们确保没有“黑色”和“白色”图片。如果图片很暗 - 它会自动变亮，如果不够暗 - 它会变暗。这可以通过自动组件轻松完成。

“缩放到 24x24 的基本分辨率”是否意味着 4916 个图像中的每一个都被重新调整为 24x24 像素？

Yes, they made sure each "face" is exactly 24x24 pixels by applying some processing on the picture.

algorithm - 中提琴琼斯实验（训练集）

1 回答 1

Related

Reference