1

非常基本的问题:

如何打印归因于任何一个集群的观察结果?

data = pd.read_csv('my_file.csv')
X = data[['Var1','Var2','Var3']]
ms = MeanShift()
ms.fit(X)
labels = ms.labels_
cluster_centers = ms.cluster_centers_

我只想查看任何一个集群的“Var1”、“Var2”、“Var3”的值。

4

1 回答 1

2

听起来您想查看数据集的预测。这可以按如下方式完成:

y_pred = ms.predict(X)

然后,您可以通过执行以下操作将这些链接到您的示例:

df['y_pred'] = y_pred

并根据需要过滤您的数据框,例如查看集群 1 中的样本:

df[df.y_pred == 1]
于 2016-11-09T23:14:03.853 回答