2

Runningh2o.automl()返回排行榜中的单个模型;但是,当尝试通过 访问实际模型时@leader@model,会出现以下错误:

is.H2OFrame(x) 中的错误:尝试从没有槽的基本类(“NULL”)的对象获取槽“指标”

同样,在调用h2o.predict()领导者模型时,收到错误消息:

.h2o.doSafeREST 中的错误(h2oRestApiVersion = h2oRestApiVersion,urlSuffix = page,:错误消息:在函数中找不到对象“虚拟”:预测参数:模型

模型在同一会话中使用h2o v3.20.0.2in运行R

4

1 回答 1

3

我认为正在发生的事情是您无法在一小时内训练一个模型,因此当您尝试收集领导者模型时,它会尝试获取不完整的模型并且您会收到错误消息。你没有很多行,但你有很多列。

由于很难预测模型训练需要多长时间,我会使用max_models参数而不是时间限制。max_models由于 AutoML 在到达or的第一个时会停止,所以max_runtime_secs我将设置max_runtime_secs为一个非常大的数字(例如 999999999),然后设置max_models = 10or 任何您喜欢的数字。

其次,由于您拥有非常广泛的数据,我建议关闭随机森林和 GBM 模型,并保留 GLM 和深度学习模型。为此,请设置exclude_algos = c("DRF", "GBM"). 在 120k 列上训练基于树的模型需要很长时间。

另一个值得考虑的好选择是首先将PCAGLRM应用于您的数据,以将维度减少到 <500 列,然后您可以在 AutoML 运行中包含基于树的模型。

于 2018-08-09T21:05:14.770 回答