0

在 H2O KMeans 集群中。有没有办法计算数据集中每个点与集群质心的实际距离?目前 H2o 为传递的数据提供预测的集群,但获取点与其集群质心的距离的最佳方法是什么。

我打算将此用于异常检测,其中远离质心的点被视为异常。我没有使用 Apache Spark,但打算使用 Sparking Water 进行尝试,但 H2o Api 似乎没有显示从集群质心获取每个点的距离的最佳方法。

4

1 回答 1

0

不幸的是,目前没有办法从 R 或 Python 中做到这一点。H2O 在Java中有一个方法,但它从未在 R/Python 中公开,所以我在这里添加了一张票。

同时,您可以编写自定义代码来执行此操作,或者您可以使用深度学习自动编码器进行异常检测(本教程中提供的示例)。

于 2018-03-06T21:42:15.023 回答