2

我在尝试对 30.000 个文本的数据集执行 KernelPCA 时遇到内存错误。RandomizedPCA 工作正常。我认为正在发生的事情是 RandomizedPCA 与稀疏数组一起使用,而 KernelPCA 则不行。

是否有人列出了当前在 scikits-learn 中通过稀疏数组支持实现的学习方法?

4

1 回答 1

1

我们还没有。您现在必须阅读各个类的文档字符串。

无论如何,对于文本文档等高暗淡的稀疏数据,非线性模型往往不会比线性模型更好地工作(而且它们更容易过拟合)。

于 2012-04-25T02:45:09.740 回答