0

我有 ASCII 数据,我需要使用 HDBSCAN 对数据进行聚类。我得到了标签,但我不知道如何打印输出集群结果,即来自 hdbscan 的唯一和隔离结果。

片段:

import hdbscan
import numpy as np

datafile = "ascii.txt"

data = np.loadtxt(datafile, dtype = np.uint8)

clusterer = hdbscan.HDBSCAN(min_cluster_size = 20)

clusterer.fit(data)

print (np.unique(clusterer.labels_, return_counts = True))
4

2 回答 2

1

您可以使用 Pandas 读取文件,然后打印出集群标签以及作为输入的数据集。尝试类似:

import pandas as pd
df = pd.read_csv("ascii.txt")
clusterer = hdbscan.HDBSCAN().fit_predict(df.ColumnName)
df_pd = pd.DataFrame({'Datapoints:' df.ColumnName, 'Cluster Labels:' clusterer)
于 2019-04-18T08:20:42.413 回答
0

导入 hdbscan

将 numpy 导入为 np

数据文件 = “ascii.txt”

数据 = np.loadtxt(数据文件,dtype = np.uint8)

Modified_data=pd.DataFrame(数据)

clusterer = hdbscan.HDBSCAN(min_cluster_size = 20)

clusterer.fit(修改数据)

Modified_data['Clusters']=clusterer.labels_

现在 Modified_data 返回一个 pandas 数据框,其中有一个名为“Clusters”的列,并且与每个实例对应的集群将在 Clusters 列中指定。您可以根据您的要求操作此数据框

于 2019-07-26T19:58:34.933 回答