我打算在sklearn.decomposition.TruncatedSVDKaggle 比赛中使用 LSA,我知道 SVD 和 LSA 背后的数学,但我对 scikit-learn 的用户指南感到困惑,因此我不确定如何实际应用
TruncatedSVD。
在doc中,它指出:
这次手术后,
U_k * transpose(S_k)是具有特征的转换训练集k(n_components在 API 中调用)
为什么是这样?我想在SVD之后,X此时X_k应该是U_k * S_k * transpose(V_k)?
然后它说,
为了也转换一个测试集
X,我们将它乘以V_k:X' = X * V_k
这是什么意思?
