java - java中svd的问题

Question

我经历了 jama 和 colt（我在 java 中编码）。他们都希望我使用数组，使得行数多于列数。

但是在潜在语义分析（LSA）的情况下，我有 5 本书，总共有 1000 多个单词。当我使用术语文档矩阵时，我得到一个 5*1000 矩阵。

由于这不起作用，我被迫转置矩阵。在转置时，我使用 1000 * 5 。使用 1000*5 当我执行 svd 时，我得到一个 5*5 的 S 矩阵。为了执行降维，这个 5*5 矩阵看起来很小。

可以做什么？

score 0 · Accepted Answer

您使用的文本段大小太大。一个文档（列）应该代表一页或几页文本，最多可能是一章。我也看到了使用的段落大小。

1 回答 1