我一直在研究这个 stacking 的例子。在这种情况下,每组 K 折叠生成一列数据,并且对每个分类器重复此操作。即:混合矩阵是:
dataset_blend_train = np.zeros((X.shape[0], len(clfs)))
dataset_blend_test = np.zeros((X_submission.shape[0], len(clfs)))
我需要堆叠来自多类问题的预测(每个样本可能有 15 个不同的类)。这将为每个 clf 生成一个 n*15 矩阵。
这些矩阵是否应该水平连接?还是应该在应用逻辑回归之前以其他方式组合它们?谢谢。