0

我在列表中有 n-dataframe

df=[df_1, df_2, df_3, ...., df_n]

其中 df_n 是 pandas (python) 中的数据框。df_n 是我的 keras 模型的变量。

X_train=[df_1_1,df_2_1,...,df_n_1]

在哪里:

df_1_1 是列表的第一个数据框(第一个变量)和该数据框的第一列,他的数据框有 m 列。

如果此变量应用不同类型的平滑或过滤器,则此数据框的每一列。

我在每个数据帧中有 100 列,我想选择(不同数据帧的)列的组合,X_train 在我的模型得分中具有最小值。

score =  model.evaluate(X_test,Y_test)

X_test 和 Y_test 是所选列的最后 n 次出现。

有一些用于选定此列的库(神经网络、GA、蚁群...)?

我该如何实施?

4

1 回答 1

0

你的预测任务是什么?您是否需要神经网络?您本质上是在这里查看特征选择问题。您可以使用更简单的模型,例如套索,它将使用 L1 正则化选择列。或者您可以使用诸如随机森林之类的集成技术并考虑相对特征重要性来选择您的列。也许看看scikit-learn

于 2018-08-17T12:12:42.350 回答