我打算在sklearn.decomposition.TruncatedSVD
Kaggle 比赛中使用 LSA,我知道 SVD 和 LSA 背后的数学,但我对 scikit-learn 的用户指南感到困惑,因此我不确定如何实际应用
TruncatedSVD
。
在doc中,它指出:
这次手术后,
U_k * transpose(S_k)
是具有特征的转换训练集k
(n_components
在 API 中调用)
为什么是这样?我想在SVD之后,X
此时X_k
应该是U_k * S_k * transpose(V_k)
?
然后它说,
为了也转换一个测试集
X
,我们将它乘以V_k
:X' = X * V_k
这是什么意思?