问题标签 [h2o]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
539 浏览

machine-learning - h2o 深度学习检查点

我正在尝试运行 h2o.deeplearning 两次,在 2 个火车组上使用检查点参数(使用相同的参数,除了不同的时期)。我收到以下错误:

错误:'训练数据的列必须与检查点模型的列相同

即使两个集合都有相同的列。下面附上相关代码:

谢谢,伊莱。

0 投票
1 回答
728 浏览

r - 无法安装 h2oEnsemble

嗨,当我尝试安装 h2oEnsemble 时出现问题。我不知道要解决这个问题。请帮忙。

我的目标是运行这个例子:

https://github.com/h2oai/h2o-world-2015-training/blob/master/tutorials/ensembles-stacking/ensembles-stacking.R


警告消息:le package 'devtools' a été compilé avec la version R 3.1.3

下载 GitHub repo h2oai/h2o-3@master loadNamespace(name) 中的错误:没有名为“RCurl”的包</p>

尝试 URL ' http://cran.rstudio.com/bin/windows/contrib/3.1/RCurl_1.95-4.7.zip ' 内容类型 'application/zip' 长度 2858866 字节 (2.7 Mb) 打开 URL 下载 2.7 Mb

install.packages 中的警告:下载长度 2858866 != 报告长度 2858866 包 'RCurl' 成功解包并检查了 MD5 总和

下载的二进制包在 C:\Users\Djilo\AppData\Local\Temp\RStudioPortableTemp\RtmpmQLJyE\downloaded_pa​​ckages

下载 GitHub repo h2oai/h2o-3@master 安装 h2oEnsemble 安装 1 个包: RCurl 包 'RCurl' 成功解压并检查 MD5 和警告:无法删除包'RCurl' 的先前安装 "E:/DATAMI~3/R-PORT~ 1/App/R-PORT~1/bin/x64/R" --no-site-file --no-environ --no-save --no-restore CMD INSTALL \"C:/Users/Djilo/AppData /Local/Temp/RStudioPortableTemp/RtmpmQLJyE/devtools177417c33da9/h2oai-h2o-3-7eaa37a/h2o-r/ensemble/h2oEnsemble-package" --library="E:/Data\Mining - R/R-Portable/App/R -便携式/库”--install-tests

  • 安装包'h2oEnsemble' ... ** R ** 测试 ** 为延迟加载 Avis 准备包:包 'statmod' 是在 R 版本 3.1.3 下构建的 loadNamespace(i,c(lib.loc,.libPaths)错误()), versionCheck = vI[[i]]):没有名为“RCurl”的包错误:无法加载包“h2o”错误:包“h2oEnsemble”的延迟加载失败
  • 删除 'E:/Data Mining - R/R-Portable/App/R-Portable/library/h2oEnsemble' 错误:命令失败 (1) 另外:警告消息:在 download.file(url, destfile, method, mode = "wb", ...) : 下载长度 2858866 != 报告长度 2858866
0 投票
1 回答
1702 浏览

r - Windows 上 R 的 h2o 给出 curl 错误:libcurl 中不支持或禁用协议“'http”

我已经在 linux 机器上成功地从 R 运行了 h2o,并且也想在 Windows 中安装它。h2o 不会为我初始化。完整的输出粘贴在下面,但关键似乎是行

这个这个经验来看,它可能与某处的单引号和双引号有关;但这似乎不太可能,因为没有人能够让 h2o / R / Windows 组合工作,我猜有些人是。另一方面,这个问题似乎表明问题在于我的 curl 安装可能没有启用 ssl。因此,我按照 h2o 页面上的建议从该向导中从头开始下载 curl ,选择 64 位版本,通用,并选择启用 SSL 和 SSH 的版本;下载它并将它最终进入的文件夹添加到我的 Windows PATH 中。但没有区别。

我刚刚注意到我的 Java 运行时环境很旧,并且也会对其进行更新。但从表面上看,这并不是问题所在。

欢迎任何建议。

0 投票
1 回答
329 浏览

r - 通过引用传递 H2O 帧

我正在处理一个非常大的数据集,我想尽可能地将数据保留在 H2O 中,而不将其带入 R。

我注意到每当我将 an 传递H2O Frame给函数时,我对 Frame 所做的任何修改都不会反映在函数之外。有没有办法通过引用传递框架?

如果不是,那么通过复制所有框架来修改函数内的原始框架的最佳方法是什么?

另一个相关问题:将 Frame 传递给其他函数(只读)是否会在 H2O 端制作额外的副本?我的数据集是 30GB - 100GB。所以要确保传递它们不会导致内存问题。

谢谢!

0 投票
2 回答
1690 浏览

r - MSE 使用 h2o 进行异常检测

我正在使用 h2o 给出的示例进行心电图异常检测。当尝试手动计算 MSE 时,我得到了不同的结果。为了证明差异,我使用了最后一个测试用例,但所有 23 个用例都不同。附上完整代码:

谢谢,伊莱。

0 投票
0 回答
80 浏览

r - 启动了 H2O 服务器,但网页版出现了一些问题

我正在尝试在 R 中启动 H2O 服务器,在我输入后它工作正常

但是,当我在浏览器中打开 127.0.0.1:54321 时,会出现以下内容。我如何找到这里的问题以及解决方案?

在此处输入图像描述

0 投票
1 回答
62 浏览

python - 弃用警告:`h2o.gbm` 已弃用。使用 estimators 子模块构建 H2OGradientBoostedEstimator

在 Python 中使用 h2o 3.6.0.8 运行 gbm 模型时,我收到以下警告:

弃用警告:h2o.gbm已弃用。使用 estimators 子模块构建 H2OGradientBoostedEstimator。

我一直在寻找有关如何构建 H2OGradientBoostedEstimator 的示例,但没有成功。你能直接指向正确的路径吗?

谢谢

0 投票
2 回答
603 浏览

r - R 中的 H2O - 自动数据处理

我注意到 H2O包提到它

预处理要标准化的数据以与激活函数兼容(回忆表 1 对每个激活函数目标空间的总结)。由于激活函数通常不会映射到实数的全谱 R,因此我们首先将数据标准化为从 N (0, 1) 中提取。在网络传播之后再次标准化允许我们在这个标准化空间中计算更精确的错误,而不是在原始特征空间中。对于自动编码,数据被归一化(而不是标准化)到 mathcalU(-0.5, 0.5) 的紧凑区间,以允许像 Tanh 这样的有界激活函数更好地重建数据。

然而,我并不完全明白。我的印象是(这里这里分类变量应该被分解为 1-of-C 虚拟变量,并且连续数据标准化然后,一切都应该标准化为 [-1,1]

我也看不到为读出层指定神经元的方法。我认为如果我们有一个分类输出变量,那么我们想使用 softmax 激活函数(并编码为 1-of-C)/如果我们有一个连续输出(例如价格),那么我们将其缩放到 [-1,1]并使用 'tanh' / 如果我们有一个二进制输出,那么我们可以使用逻辑并将其编码为 [0,1]

0 投票
1 回答
49 浏览

r - H2O 添加额外的神经元来读入

我有一个训练数据集(森林覆盖类型),它有 10 个连续变量,然后是 2 个分类变量(有 40 个和 4 个级别)。所以在我看来,我的读入层应该包含 54 个神经元(我使用的是 1-of-C)。同样,我发现了另一个版本的数据(这里),它确实声称有 54 个属性。

以下是我对我的模型的表示: 在此处输入图像描述

问题是当我在 R 中使用 H2O 时;它告诉我我有 204,707 个参数(第一层有 56 个神经元)。我不明白为什么它将分类(或如何)分解为 N+1?我检查了,没有缺失值

0 投票
1 回答
965 浏览

r - 如何从 H2O 异常检测中解释重建 MSE?

我正在使用 h2o 进行数据中的异常检测。数据包含几个连续的分类特征,标签可以是 0 或 1。现在,因为 1 的计数小于 1%,我正在尝试异常检测技术,而不是使用通常的分类方法。但是,最后我得到每行数据的 MSE 计算,我不确定如何解释它才能说实际标签为 0,但因为它是异常情况,应该为 1。

到目前为止我使用的代码:

head(pred.oc)