python - 用于分位数回归的 sklearn RandomizedSearchCV 的自定义损失函数

翻译自：https://stackoverflow.com/questions/67867708 2021-06-07T07:40:30.557

134 次

我正在使用 sklearns 梯度增强回归器通过将损失指定为quantile. 在进行 RandomizedSearchCV 时，要找到最佳超参数，这不是一个选项。因此，我认为我需要构建自己的丢失功能，但到目前为止我还没有成功。

以下是我迄今为止构建自己的损失函数的最佳选择。我正在使用 sklearn make_scorer：

def mqloss(y_true, y_pred):
    if (alpha_global > 0) and (alpha_global < 1):
        residual = y_true - y_pred 
        return np.mean(residual * (alpha_global - (residual<0)))
    else:
        return np.nan

scorer = make_scorer(mqloss, greater_is_better=True)

下面我训练我的模型：

quantiles = [0.05, 0.25, 0.5, 0.75, 0.95]
for i in range(len(quantiles)):
    reg = GradientBoostingRegressor(random_state=42, loss='quantile', alpha=quantiles[i])
    reg_gs = RandomizedSearchCV(reg, grid_GB, random_state=42, n_iter=50, 
                                cv=5, scoring='neg_mean_squared_error')
    reg_gs.fit(X_train,y_train)
    param = reg_gs.best_params_
    print(param)

这确实运行但似乎做得不太好。第 25、50、75 和 95 分位数的预测分位数值完全相同。是有错误还是我的数据很奇怪？

python - 用于分位数回归的 sklearn RandomizedSearchCV 的自定义损失函数

0 回答 0

Related

Reference