r - 通过@leader@model 访问 automl leader 时返回空列表

Question

Runningh2o.automl()返回排行榜中的单个模型；但是，当尝试通过访问实际模型时@leader@model，会出现以下错误：

is.H2OFrame(x) 中的错误：尝试从没有槽的基本类（“NULL”）的对象获取槽“指标”

同样，在调用h2o.predict()领导者模型时，收到错误消息：

.h2o.doSafeREST 中的错误（h2oRestApiVersion = h2oRestApiVersion，urlSuffix = page，：错误消息：在函数中找不到对象“虚拟”：预测参数：模型

模型在同一会话中使用h2o v3.20.0.2in运行R。

score 3 · Accepted Answer

我认为正在发生的事情是您无法在一小时内训练一个模型，因此当您尝试收集领导者模型时，它会尝试获取不完整的模型并且您会收到错误消息。你没有很多行，但你有很多列。

由于很难预测模型训练需要多长时间，我会使用max_models参数而不是时间限制。max_models由于 AutoML 在到达or的第一个时会停止，所以max_runtime_secs我将设置max_runtime_secs为一个非常大的数字（例如 999999999），然后设置max_models = 10or 任何您喜欢的数字。

其次，由于您拥有非常广泛的数据，我建议关闭随机森林和 GBM 模型，并保留 GLM 和深度学习模型。为此，请设置exclude_algos = c("DRF", "GBM"). 在 120k 列上训练基于树的模型需要很长时间。

另一个值得考虑的好选择是首先将PCA或GLRM应用于您的数据，以将维度减少到 <500 列，然后您可以在 AutoML 运行中包含基于树的模型。

r - 通过@leader@model 访问 automl leader 时返回空列表

1 回答 1

Related

Reference