python - 如何使用 scikit learn/pandas/python 打印任何一个集群的样本/观察/行？

Question

非常基本的问题：

如何打印归因于任何一个集群的观察结果？

data = pd.read_csv('my_file.csv')
X = data[['Var1','Var2','Var3']]
ms = MeanShift()
ms.fit(X)
labels = ms.labels_
cluster_centers = ms.cluster_centers_

我只想查看任何一个集群的“Var1”、“Var2”、“Var3”的值。

score 2 · Accepted Answer

听起来您想查看数据集的预测。这可以按如下方式完成：

y_pred = ms.predict(X)

然后，您可以通过执行以下操作将这些链接到您的示例：

df['y_pred'] = y_pred

并根据需要过滤您的数据框，例如查看集群 1 中的样本：

df[df.y_pred == 1]

python - 如何使用 scikit learn/pandas/python 打印任何一个集群的样本/观察/行？

1 回答 1

Related

Reference