0

我经历了 jama 和 colt(我在 java 中编码)。他们都希望我使用数组,使得行数多于列数。

但是在潜在语义分析(LSA)的情况下,我有 5 本书,总共有 1000 多个单词。当我使用术语文档矩阵时,我得到一个 5*1000 矩阵。

由于这不起作用,我被迫转置矩阵。在转置时,我使用 1000 * 5 。使用 1000*5 当我执行 svd 时,我得到一个 5*5 的 S 矩阵。为了执行降维,这个 5*5 矩阵看起来很小。

可以做什么?

4

1 回答 1

0

您使用的文本段大小太大。一个文档(列)应该代表一页或几页文本,最多可能是一章。我也看到了使用的段落大小。

于 2012-06-28T17:16:39.500 回答