2

我正在使用spotify 曲目数据库并试图了解列可舞性、活力和能量如何影响流行度(使用离散流行度:-1、0、1)。我想从三列降维到两列。这是片段:

reducer = umap.UMAP(n_neighbors=10, min_dist=0.1)
X_reduced = reducer.fit_transform(X)

plt.figure(figsize=(10, 5))
plt.title('Projecting %d-dimensional data to 2D' % X.shape[1])
plt.scatter(X_reduced[:, 0], X_reduced[:, 1], c=y, edgecolor='none', s=20,
            cmap=ListedColormap(['yellow', 'red', 'green']))
plt.colorbar(ticks=range(3), label='popularity value')
plt.show()

但是这段代码向我显示了流行和不流行的曲目相同的数据(图 1),而我需要获取具有 3 个不同集群的数据(图 2)。 图 1 图 2

我认为问题可能出在 umap 参数中,或者可能是糟糕的集群化任务。我试图以某种方式改变它,但它没有用。

4

0 回答 0