我想运行 MLLIB (Apache Spark) 的 KMeans 算法,但结果可重现。
是否可以使用固定种子运行 MLLIB (Apache Spark) 的 KMeans?如何?
谢谢并恭祝安康,
我想运行 MLLIB (Apache Spark) 的 KMeans 算法,但结果可重现。
是否可以使用固定种子运行 MLLIB (Apache Spark) 的 KMeans?如何?
谢谢并恭祝安康,
从 Spark 1.2 开始,这似乎是不可能的。它在内部生成种子。
从 1.4.0 版开始,Spark MLLib 中提供了 KMeans 的设置种子,请参见此处的文档库