-1

在将训练数据集提供给聚类模型之前,我正在使用 StandardScaler 转换数据。

X = StandardScaler().fit_transform(X_train)

假设,clf 是无监督集群模型,我预测标签如下:

y = clf.predict(X)

问题:如何组合“y”和“X_train”numpy 数组?我不确定 StandardScaler() 是否保持矩阵内的顺序。那么,这会奏效吗?

df = pd.DataFrame(np.array(X_train), np.array(y))
4

1 回答 1

1

是的,所有 scikit-learn 转换器都保持样本的顺序。否则它们将毫无用处。

于 2014-12-05T19:20:05.533 回答