问题标签 [h2o.ai]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
101 浏览

r - 在 R 中初始化 H2O 时出错 - 无法分配内存

我试图在具有 500 万条记录和 70 个特征的数据集上使用 R 中的 h2o 在具有 32 GB RAM 的 linux 服务器上运行 automl 模型。

这是我试图运行的代码:

我收到了这个错误:

|==== | .h2o.doSafeREST 中的 8% 错误(h2oRestApiVersion = h2oRestApiVersion,urlSuffix = page,:意外的 CURL 错误:接收失败:连接由 .h2o.doSafeREST 中的 peerError 重置(h2oRestApiVersion = h2oRestApiVersion,urlSuffix = urlSuffix,:意外的 CURL 错误:连接失败到 localhost:54321;连接被拒绝

然后,在我尝试使用以下命令初始化 h2o 时重新启动 R 会话并进行所有清理后:

h2o.init()

它给了我一个错误:

H2O 尚未运行,现在开始运行...系统出错(粘贴(which, shQuote(names[i])),intern = TRUE,ignore.stderr = TRUE):无法打开 '/usr/bin/which' java' 2>/dev/null',可能的原因'无法分配内存'

有谁知道如何修理它。我还没有在网上找到任何解决方案。

编辑 1

通过重启服务器;h2o got 正在使用h2o.init. 并且,通过使用keep_cross_validation_models = Fin h2o.automl; 模型生成完成到 100%。

h2o.automl但是,在进度条达到 100%后,我开始收到这个新错误。

|=================================================== =====| 100% 错误:意外的 HTTP 状态代码:500 服务器错误(url = http://localhost:54321/3/Jobs/$03017f00000132d4ffffffff$_8d3c6f4c4fd73944d1ce4624042d44a9)错误:解析错误:过早的 EOF(就在这里)------^

编辑2:

通过重新启动服务器并通过添加max_mem_size = "12g"选项来初始化 h2o,问题得到了解决。

0 投票
0 回答
293 浏览

r - R 中的 H2o AutoML:XGBoost 不可用;跳过它

我正在尝试运行 H2o 的 automl,我想在 automl 中查看 XGboost 的结果。当我尝试运行此代码时:

我收到这条消息:

  | | 0% 16:25:37.796:AutoML:XGBoost 不可用;跳过它。作业 $03017f00000132d4ffffffff$_8c51b0759fd2e77fd8940b41f83340c2 已取消。

我在 Centos 7 linux 服务器上使用 H2o 3.32.1.1 版本。我正在使用 R 3.6.0 版本。我使用以下方法安装了 H2o:

install.packages("h2o", type="source", repos=(c("http://h2o-release.s3.amazonaws.com/h2o/latest_stable_R"))) 如给出: https ://docs.h2o.ai/h2o/latest-stable/h2o-docs/downloading.html

请帮忙。我不知道为什么 xgboost 不在 automl 中运行。以及,如何解决。我在网上找不到任何解决方案来解决这个问题。

编辑

通过在 R 中安装xgboost软件包解决了问题。感谢大家的评论并指导我xgboost在 R 中安装。

0 投票
0 回答
38 浏览

python - H2O 中的 GLRM - 使用逆变换检索 X 矩阵

我使用选项构建了我的 GLRM 模型:transform="standardize",它输出标准化的 X 和 Y 矩阵。我可以使用以下方法将 Y 矩阵检索回原始训练数据特征空间:

关于矩阵 X,我只能使用以下代码对其进行标准化检索:

有人可以帮助我理解如何使矩阵 X 不标准化吗?

先感谢您,

路易莎·诺盖拉

0 投票
0 回答
11 浏览

h2o - 有没有办法指定一个列总是添加到 h2o 中的树(RF,GBM)中?

我想指定应该为 h2o randomforest/gbm函数中的每棵树“提供”一列。(随机森林采用列的子样本,我想确保每个子集都有我最喜欢的列。)这可能吗?

(我没有可重复的例子,这是一个概念问题。)

0 投票
2 回答
2053 浏览

python - ModuleNotFoundError:没有名为“h2oaicore”的模块

我正在关注无人驾驶的教程:Driverless AI Standalone Python Scoring Pipeline,您可以在以下链接中查看:

http://docs.h2o.ai/driverless-ai/latest-stable/docs/userguide/scoring-standalone-python.html#tar-method-py

我正在表演:

运行 Python 评分过程 - 推荐

但是,在运行最后一步时:

DRIVRLESS_AI_LICENSE_KEY = "这里粘贴密钥" SCORING_PIPELINE_INSTALL_DEPENDENCIES = 0 /path/to/your/dai-env.sh ./run_example.sh

发生以下错误:

回溯(最近一次调用最后一次):文件“example.py”,第 7 行,从scoring_h2oai_experiment_5fd7ff9c_b11a_11eb_b91f_0242ac110002 导入记分器文件“/usr/local/lib/python3.6/dist-packages/scoring_h2oai_experiment_5fd7ff9c_b11a_11,100102/init 0242.py 行在

第 7 行,在

ModuleNotFoundError:没有名为“h2oaicore”的模块

- 希望你能帮助我,在此先感谢。

0 投票
1 回答
58 浏览

amazon-web-services - 我应该使用 EC2 虚拟机中的哪些参数来优化 H2O 的 XGBoost 性能?

我正在尝试在 r4.8x large 上运行 H2O xgboost。但是运行时间太长(15 小时以上,而具有相同超参数网格大小的 GBM 需要 4 小时)。

知道 XGBoost 使用缓存优化,是否有任何特定的实例类型最适合 H2O 的 XGBoost 实现?

我的训练数据有 28K 行和 150 个二进制列。我正在运行网格搜索。

0 投票
1 回答
291 浏览

python - H2O 本地服务器意外死机

我在复制H2O 文档中的 AutoML 教程时遇到问题。启动我的 h2o 本地服务器 ( h2o.init()) 后,我得到以下输出,这听起来是正确的:

接下来,我按照教程的规定导入数据集:

最后,我训练我的 AutoML 模型:

那是当它崩溃并显示以下消息时:

尝试了不同的数据集,包括一些样本,以防它是内存问题但无济于事。错误占上风。

任何人都知道我应该怎么做才能解决这个问题?

非常感激!

问候。

0 投票
1 回答
28 浏览

python - 我们可以在 h2o automl 中设置窗口大小来预测时间序列数据集吗?

我正在尝试使用h2o automl对时间序列数据集进行股票价格预测。如果我想使用前 5 天的历史预测未来 3 天的收盘价,我可以在 h2o automl 中设置这种窗口大小吗?

0 投票
1 回答
32 浏览

snowflake-cloud-data-platform - 在雪花中部署 h2o.ai 训练有素的学习者

我正在阅读建议 h2o.ai 将其 ML 集成到雪花中的文章标题。 https://www.h2o.ai/resources/solution-brief/integration-of-h2o-driverless-ai-with-snowflake/

如果我想像 gbm 一样导出 POJO 学习器并让它在雪花中运行,有没有一种干净的方法可以做到这一点?我在找到的(几篇)文章中没有看到任何明确的方向。

它如何与 ML-ops 集成?

0 投票
1 回答
52 浏览

r - 如何解决 R 中的此错误:water.exceptions.H2OConcurrentModificationException:无法汇总,因为 Vec 已被删除?

对于我在 Rstudio 上第一次使用 Package H2o,我收到了 Ridge 模型的以下消息

这是我使用的代码,不幸的是我无法共享我的数据库,因为它是机密的