在将训练数据集提供给聚类模型之前,我正在使用 StandardScaler 转换数据。
X = StandardScaler().fit_transform(X_train)
假设,clf 是无监督集群模型,我预测标签如下:
y = clf.predict(X)
问题:如何组合“y”和“X_train”numpy 数组?我不确定 StandardScaler() 是否保持矩阵内的顺序。那么,这会奏效吗?
df = pd.DataFrame(np.array(X_train), np.array(y))