问题标签 [h2o]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

1783 问题

0 投票

1 回答

175 浏览

amazon-ec2 - 在 EC2 上使用 H2O 的默认 RStudio 服务器用户

我正在尝试使用 H2O 附带的 RStudio 服务器安装，按照在 EC2此处启动它的说明进行操作。所有这一切都成功完成，我让 RStudio 在端口 8787 上工作，但是，我不知道默认登录凭据是什么。有吗？是否必须登录 EC2 实例并手动配置用户？

2015-08-27T18:04:22.407

0 投票

1 回答

637 浏览

scala - 如何在 Scala 中将 Dataframe 转换为 H2O？

谢谢你问我的问题。我现在正在将 RDD 转换为 DF 到 H2O。我非常坚持H2O部分。如何将 Scala DataFrame 转换为 H2O？

scala rdd h2o

2015-09-04T14:24:38.837

0 投票

1 回答

749 浏览

h2o - h2o.auc( perf , xval =TRUE) - 这个调用返回什么？

我的代码如下

perf <- h2o.performance(gbm.fit.hex , tr.hex) a = h2o.auc(perf , xval = TRUE)

auc 调用返回什么？它返回训练数据集或交叉验证结果的 AUC 吗？

h2o

2015-09-05T18:51:01.830

0 投票

1 回答

772 浏览

scala - 如何在 Scala 中基于 H2OFrame 中的现有列添加列

如何在 Scala 中基于 H2OFrame 中的现有列添加列？

我想添加一个新列，它是现有列的日志。我怎样才能做到这一点？谢谢

scala h2o

2015-09-09T14:42:59.607

0 投票

1 回答

872 浏览

r - h2o 随机森林解释的误差度量

我正在使用以下参数设置运行 h2o 随机森林

运行后，我得到以下输出。

以下是我的问题。

1) MSE 和 R2 是什么意思？

2）如果它们是均方误差或类似的，为什么我要获得这些指标用于分类设置？

3) 我如何获得其他指标，如 gini 或 auc？

4）我可以说如果这两个参数随着不同的参数设置而减少，我的模型性能有所提高吗？

r random-forest h2o

2015-09-15T10:40:24.250

0 投票

1 回答

2684 浏览

r - 如何在 h2o 随机森林中指定分类

我正在互联网上寻找如何在 h2o.randomForest 中指定分类。无论我能找到什么，我们都可以将参数“分类”设置为 TRUE。但根据 h2o 包文档，它不再存在。

见这里https://cran.r-project.org/web/packages/h2o/h2o.pdf

当我在目标变量是二进制 1-0 变量的数据上运行这个 h2o.randomForest 时，它假设回归。

我不知道如何告诉它我想做分类。

任何帮助将不胜感激。

谢谢

r random-forest h2o

2015-09-15T12:58:14.230

0 投票

1 回答

52 浏览

r - R中H2o对象的随机离散值生成

我想为我的 H2o 对象（3GB 数据）生成随机离散值，如下例所示。

例子：

我已经编写了如下的 R-h2o 代码，但是我无法得到我的结果。

以下是我的 H2o 集群详细信息

我认为这发生在 R 和 H2o 对象之间的数据类型问题上，即 R 没有将 h2o 对象的数值读取为数字。对于其他一些条件操作，我也面临同样的问题。

r bigdata h2o

2015-09-16T09:48:57.980

0 投票

1 回答

826 浏览

r - 再次加载 h2o 随机森林模型对象后无法对测试数据进行评分

我正在使用h2o包R来构建随机森林模型。我的任务需要我在以后重复对测试数据进行评分，因此我将随机森林模型对象保存如下。

为了对数据进行评分，稍后我将模型对象再次加载回内存中，如下所示

但是当我使用得分时

我收到以下错误

当我使用 R 包构建模型时，整个保存、加载和评分方法工作正常，但在这里以某种方式失败。有人可以提供解决方案吗？每次我想对一些数据进行评分时，我都无法再次重建模型。

H2o 连接似乎很好，因为当模型是新建的并且仍然存在于内存中时，评分会顺利进行。

r random-forest h2o

2015-09-18T12:50:58.340

0 投票

1 回答

1964 浏览

r - h2o.randomforest 如何处理缺失值

在我对 h2o 的研究之后，我发现 h2o.randomForest 可以处理变量中的缺失值，这与 R randomForest 包不同。

见，http://h2o.ai/blog/2014/04/sjsu-tutorial-h2o-random-forest/

但是，在到处寻找之后，我似乎无法找到 h2o.randomForest 究竟是如何处理缺失值的？它与 R gbm() 包处理缺失值的相似程度如何？

任何有关上述 2 个问题的帮助将不胜感激。

谢谢，

r random-forest h2o

2015-09-24T14:29:42.117

0 投票

1 回答

751 浏览

r - 在 R 中创建 2 个 h2o 实例

我有一个使用 h2o.randomForest() 的随机森林模型。

现在，我需要使用 h2o.predict() 对大量数据进行评分。由于一些限制，我无法一次对所有数据进行评分。所以基本上我想在一个循环中对不同的数据集进行评分。所以，为了加快这个过程，我想通过在 2 个不同的 R 实例中运行相同的脚本来同时对多个数据集进行评分。但是当我这样做时，一个实例运行良好，但其他实例给我以下错误。有时这两个实例都会出现此错误。

上面的错误甚至不一致，有时我得到它有时我没有。

我正在初始化 h2o 并在所有 R 实例中进行如下预测。

我怎样才能做到这一点？如何通过 2 个不同的 R 实例使用 h2o 云？

谢谢，

r parallel-processing multiple-instances h2o

2015-09-28T09:12:43.707

1 2 3 4 5 6 7 8 9 10

问题标签 [h2o]

Reference