问题标签 [h2o]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
amazon-ec2 - 在 EC2 上使用 H2O 的默认 RStudio 服务器用户
我正在尝试使用 H2O 附带的 RStudio 服务器安装,按照在 EC2此处启动它的说明进行操作。所有这一切都成功完成,我让 RStudio 在端口 8787 上工作,但是,我不知道默认登录凭据是什么。有吗?是否必须登录 EC2 实例并手动配置用户?
scala - 如何在 Scala 中将 Dataframe 转换为 H2O?
谢谢你问我的问题。我现在正在将 RDD 转换为 DF 到 H2O。我非常坚持H2O部分。如何将 Scala DataFrame 转换为 H2O?
h2o - h2o.auc( perf , xval =TRUE) - 这个调用返回什么?
我的代码如下
perf <- h2o.performance(gbm.fit.hex , tr.hex)
a = h2o.auc(perf , xval = TRUE)
auc 调用返回什么?它返回训练数据集或交叉验证结果的 AUC 吗?
scala - 如何在 Scala 中基于 H2OFrame 中的现有列添加列
如何在 Scala 中基于 H2OFrame 中的现有列添加列?
我想添加一个新列,它是现有列的日志。我怎样才能做到这一点?谢谢
r - h2o 随机森林解释的误差度量
我正在使用以下参数设置运行 h2o 随机森林
运行后,我得到以下输出。
以下是我的问题。
1) MSE 和 R2 是什么意思?
2)如果它们是均方误差或类似的,为什么我要获得这些指标用于分类设置?
3) 我如何获得其他指标,如 gini 或 auc?
4)我可以说如果这两个参数随着不同的参数设置而减少,我的模型性能有所提高吗?
r - 如何在 h2o 随机森林中指定分类
我正在互联网上寻找如何在 h2o.randomForest 中指定分类。无论我能找到什么,我们都可以将参数“分类”设置为 TRUE。但根据 h2o 包文档,它不再存在。
见这里https://cran.r-project.org/web/packages/h2o/h2o.pdf
当我在目标变量是二进制 1-0 变量的数据上运行这个 h2o.randomForest 时,它假设回归。
我不知道如何告诉它我想做分类。
任何帮助将不胜感激。
谢谢
r - R中H2o对象的随机离散值生成
我想为我的 H2o 对象(3GB 数据)生成随机离散值,如下例所示。
例子 :
我已经编写了如下的 R-h2o 代码,但是我无法得到我的结果。
以下是我的 H2o 集群详细信息
我认为这发生在 R 和 H2o 对象之间的数据类型问题上,即 R 没有将 h2o 对象的数值读取为数字。对于其他一些条件操作,我也面临同样的问题。
r - 再次加载 h2o 随机森林模型对象后无法对测试数据进行评分
我正在使用h2o
包R
来构建随机森林模型。我的任务需要我在以后重复对测试数据进行评分,因此我将随机森林模型对象保存如下。
为了对数据进行评分,稍后我将模型对象再次加载回内存中,如下所示
但是当我使用得分时
我收到以下错误
当我使用 R 包构建模型时,整个保存、加载和评分方法工作正常,但在这里以某种方式失败。有人可以提供解决方案吗?每次我想对一些数据进行评分时,我都无法再次重建模型。
H2o 连接似乎很好,因为当模型是新建的并且仍然存在于内存中时,评分会顺利进行。
r - h2o.randomforest 如何处理缺失值
在我对 h2o 的研究之后,我发现 h2o.randomForest 可以处理变量中的缺失值,这与 R randomForest 包不同。
见,http://h2o.ai/blog/2014/04/sjsu-tutorial-h2o-random-forest/
但是,在到处寻找之后,我似乎无法找到 h2o.randomForest 究竟是如何处理缺失值的?它与 R gbm() 包处理缺失值的相似程度如何?
任何有关上述 2 个问题的帮助将不胜感激。
谢谢,
r - 在 R 中创建 2 个 h2o 实例
我有一个使用 h2o.randomForest() 的随机森林模型。
现在,我需要使用 h2o.predict() 对大量数据进行评分。由于一些限制,我无法一次对所有数据进行评分。所以基本上我想在一个循环中对不同的数据集进行评分。所以,为了加快这个过程,我想通过在 2 个不同的 R 实例中运行相同的脚本来同时对多个数据集进行评分。但是当我这样做时,一个实例运行良好,但其他实例给我以下错误。有时这两个实例都会出现此错误。
上面的错误甚至不一致,有时我得到它有时我没有。
我正在初始化 h2o 并在所有 R 实例中进行如下预测。
我怎样才能做到这一点?如何通过 2 个不同的 R 实例使用 h2o 云?
谢谢,