0

我试图在具有 500 万条记录和 70 个特征的数据集上使用 R 中的 h2o 在具有 32 GB RAM 的 linux 服务器上运行 automl 模型。

这是我试图运行的代码:

aml <- h2o.automl(y = y, x = x, training_frame = train, seed = 123)

我收到了这个错误:

|==== | .h2o.doSafeREST 中的 8% 错误(h2oRestApiVersion = h2oRestApiVersion,urlSuffix = page,:意外的 CURL 错误:接收失败:连接由 .h2o.doSafeREST 中的 peerError 重置(h2oRestApiVersion = h2oRestApiVersion,urlSuffix = urlSuffix,:意外的 CURL 错误:连接失败到 localhost:54321;连接被拒绝

然后,在我尝试使用以下命令初始化 h2o 时重新启动 R 会话并进行所有清理后:

h2o.init()

它给了我一个错误:

H2O 尚未运行,现在开始运行...系统出错(粘贴(which, shQuote(names[i])),intern = TRUE,ignore.stderr = TRUE):无法打开 '/usr/bin/which' java' 2>/dev/null',可能的原因'无法分配内存'

有谁知道如何修理它。我还没有在网上找到任何解决方案。

编辑 1

通过重启服务器;h2o got 正在使用h2o.init. 并且,通过使用keep_cross_validation_models = Fin h2o.automl; 模型生成完成到 100%。

h2o.automl但是,在进度条达到 100%后,我开始收到这个新错误。

aml <- h2o.automl(y = y, x = x, training_frame = train, keep_cross_validation_models = F, seed = 123)

|=================================================== =====| 100% 错误:意外的 HTTP 状态代码:500 服务器错误(url = http://localhost:54321/3/Jobs/$03017f00000132d4ffffffff$_8d3c6f4c4fd73944d1ce4624042d44a9)错误:解析错误:过早的 EOF(就在这里)------^

编辑2:

通过重新启动服务器并通过添加max_mem_size = "12g"选项来初始化 h2o,问题得到了解决。

4

0 回答 0