2

问题的背景

我试图使用KerasRegressor带有 ML 模型的模型(例如 Lasso、Gradient Boost Regressor)来构建集成方法。我使用VotingRegressor()sklearn 的功能对模型进行分组。但是,当我在 中添加KerasRegressor模型时VotingRegressor(),出现以下错误。

ValueError:估计器 KerasRegressor 应该是回归器。

我是如何尝试解决问题的?

我在谷歌上搜索错误,我发现只有这个页面我没有找到解决方案。此外,我试图理解. KerasRegressor但是,我不知道为什么会收到错误,因为文档说它是 Keras 的 scikit-learn regressor API 的实现

然后,我的问题

为什么我会收到错误,我可以做些什么来解决它?

任何帮助将不胜感激 :)。谢谢!

4

1 回答 1

4

从这个问题没有使用 keras 的解决方案,因为 sklearn 包装器未维护并将被删除

幸运的是scikeras包解决了这个问题。

我建议您阅读文档或教程,但这里有一个使用子类的简单示例:

!pip install scikeras

import scikeras
from tensorflow import keras
from sklearn.datasets import make_regression
from sklearn.ensemble import VotingRegressor
from sklearn.linear_model import LinearRegression

class MLPRegressor(KerasRegressor):

    def __init__(
        self,
        hidden_layer_sizes=(100, ),
        optimizer="adam",
        optimizer__learning_rate=0.001,
        epochs=10,
        verbose=0,
        **kwargs,
    ):
        super().__init__(**kwargs)
        self.hidden_layer_sizes = hidden_layer_sizes
        self.optimizer = optimizer
        self.epochs = epochs
        self.verbose = verbose

    def _keras_build_fn(self, compile_kwargs):
        model = keras.Sequential()
        inp = keras.layers.Input(shape=(self.n_features_in_))
        model.add(inp)
        for hidden_layer_size in self.hidden_layer_sizes:
            layer = keras.layers.Dense(hidden_layer_size, activation="relu")
            model.add(layer)
        out = keras.layers.Dense(1)
        model.add(out)
        model.compile(loss="mse", optimizer=compile_kwargs["optimizer"])
        return model

# simple linear regression
r1 = LinearRegression()
# keras model wrapper
r2= MLPRegressor(epochs=20)  


X = (y/2).reshape(-1, 1)
y = np.arange(100)

#defining votting classifier
vr = VotingRegressor([('lr', r1), ('MLPReg', r2)])

vr.fit(X,y)

VotingRegressor(estimators=[('lr', LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None, normalize=False)), ('MLPReg', MLPRegressor(batch_size=None, build_fn=None, callbacks=None, epochs =20, hidden_​​layer_sizes=(100,), loss=None, metrics=None, model=None, optimizer='adam', random_state=None, run_eagerly=False, shuffle=True, validation_batch_size=None, validation_split=0.0, verbose= 0, warm_start=False))], n_jobs=None, weights=None)

于 2021-04-11T07:21:16.313 回答