运行 scikit 的 dbscan 算法时出现内存错误。我的数据大约是 20000*10000,它是一个二进制矩阵。
(也许DBSCAN不适合用这样的矩阵。我是机器学习的初学者。我只想找到一个不需要初始簇号的簇方法)
无论如何,我发现了 scikit 的稀疏矩阵和特征提取。
http://scikit-learn.org/dev/modules/feature_extraction.html http://docs.scipy.org/doc/scipy/reference/sparse.html
但我仍然不知道如何使用它。在 DBSCAN 的规范中,没有关于使用稀疏矩阵的指示。不允许吗?
如果有人知道如何在 DBSCAN 中使用稀疏矩阵,请告诉我。或者你可以告诉我一个更合适的集群方法。