我正在学习奇异值分解,出于什么目的我可以使用这个概念,我正在阅读的书提到 SVD 用于潜在语义索引。我读了几篇关于 LSI 的文章,似乎 LSI 主要用于搜索引擎和类似的应用程序。我想将 LSI 用于我正在从事的小型数据分析项目,但我不确定它是否对我的应用程序有意义。这是我正在使用的。
我有一个大约 20000 款游戏的列表,其中 2 个属性是游戏类型和游戏发布平台。我想使用 LSI 来获取有关平台和流派属性的一些信息。
所以起初我创建了一个共现矩阵,其中行代表 24 个不同的流派,列代表 22 个不同的平台。然后我对共现矩阵进行了 SVD 分解,提取了 U 和 V 的前两列,并为 U 和 V 绘制了一个二维图。该图如下所示。
所以我的问题是,这是否可以被认为是潜在语义索引的有意义的使用,以及我如何从该图中进行解释?例如,我们看到动作类型和平台 PC 与所有其他变量相距甚远,这是否特别告诉我们有关该类型和平台的任何信息?
谢谢你。