0

作为学校项目的一部分,我不得不阅读 Steven Lawrence 的一篇关于使用 SOM 和 CCN 检测人脸的论文。对于那些好奇的人,这里的论文:http ://clgiles.ist.psu.edu/papers/UMD-CS-TR-3608.face.hybrid.neural.nets.pdf

在论文的第 12 页,Lawrence 描述了他如何使用 SOM 来降低人脸数据的维度。但是,我不明白这是如何工作的。在此示例中,Lawrence 使用 5x5x5 SOM,输入向量为 25D。如果我的理解是正确的,那么当训练过程完成时,你会留下一个 25D 向量,连接到网络中的每个神经元。那么,这如何减少数据的维度呢?自组织地图上的降维数据到底在哪里?我在很多地方进行了研究,但由于某种原因,我找不到这个问题的答案。由于这个问题已经困扰了我一段时间,如果有人可以为我回答,将不胜感激。

4

1 回答 1

0

每个训练集包含十张图像,在 5x5 网格中采样(这是 25D 向量),因此每个训练集(人脸)可以被视为 250D 向量。

第 2 页

有40 个不同主题的10 个不同图像。

Lawrence 使用了一个每维有 5 个节点的 3D som,它符合一个 (5x5x5) 125D 向量,该向量保留了原始数据的拓扑信息。

第 12 页

SOM 将 25 维输入向量s量化为 125 个拓扑有序值。SOM 的三个维度可以被认为是三个特征

您可能会意识到数据维度减少了二维,空间维度减少了五。

希望这可以帮助

于 2013-07-21T15:49:32.057 回答