背景
我正在通过从头开始构建自己的文本挖掘工具包来学习文本挖掘——这是最好的学习方式!
SVD
奇异值分解通常被认为是一种很好的方法:
- 在 2d/3d 中可视化高维数据(word-document 矩阵)
- 通过降维提取关键主题
我已经花了大约一个月的时间来学习 SVD .. 我必须承认很多在线教程、论文、大学讲座幻灯片……甚至是正确的印刷教科书都不是那么容易消化的。
到目前为止,这是我的理解:SVD 揭秘(博客)
我想我已经理解了以下内容:
- 任何(实)矩阵都可以使用 SVD 唯一地分解为 3 个相乘矩阵,A=U⋅S⋅V^T
- S 是奇异值的对角矩阵,按数量级降序排列
- U 和 V^T 是正交向量的矩阵
我知道我们可以通过将 S 的较小元素归零并重建原始数据来过滤掉不太重要的信息来减少维度。如果我想将维度减少到 2,我只会保留对角线 S 的最左上角的 2 个元素来形成一个新的矩阵 S'
我的问题
为了查看投影到降维空间上的文档,我看到人们使用 S'⋅V^T。为什么?S'⋅V^T的解释是什么?
同样,为了查看主题,我看到人们使用 U⋅S'。为什么?对此有何解释?
我有限的学校数学告诉我应该将这些视为转换(旋转,比例)......但这也无助于澄清它。
** 更新 ** 我在SVD demystified (blog)上的博客解释中添加了更新,这反映了我查看的一本教科书的基本原理,以解释为什么 S'.V^T 是文档视图,以及为什么美国' 是一个单词视图。还是不太相信……