我是 H2O DAI 的新手,我觉得这很棒。我用小样本 CSV 数据进行了几次实验,大多数时候我看到使用 GLM 和 GBM。
我们能看到 H2O DAI 提供的所有算法的完整列表吗?
我在这里看到了 H2O 开源提供的算法,但它与 H2O DAI 相同吗?
还有一个问题:有什么方法可以选择手动使用哪种算法?
我是 H2O DAI 的新手,我觉得这很棒。我用小样本 CSV 数据进行了几次实验,大多数时候我看到使用 GLM 和 GBM。
我们能看到 H2O DAI 提供的所有算法的完整列表吗?
我在这里看到了 H2O 开源提供的算法,但它与 H2O DAI 相同吗?
还有一个问题:有什么方法可以选择手动使用哪种算法?
请注意,H2O-3 是一个单独的开源产品,与 H2O.ai 的 DAI 产品不同。
找到所有问题答案的最佳方法是查看 Driverless AI 文档:http: //docs.h2o.ai/driverless-ai/latest-stable/docs/userguide/index.html
为了您的方便,我将发布您问题的答案,但对于以后遇到此问题的任何人,我强烈建议您只查看文档,因为我现在所说的内容可能很快就会过时。
我们能看到 H2O DAI 提供的所有算法的完整列表吗?(在常见问题解答中回答)
无人驾驶 AI 中使用了哪些算法?
功能是使用专有的 Kaggle 统计方法堆栈设计的,包括一些基于分组、聚合和连接的最复杂的目标编码和似然估计,但我们还采用线性模型、神经网络、聚类和降维模型以及许多传统的方法,例如 one-hot 编码等。
除了工程特征之外,还安装了复杂的模型,包括但不限于:XGBoost(原始 XGBoost 和“lossguide”(LightGBM)模式)、GLM、TensorFlow(包括基于 CNN 深度学习模型的 TensorFlow NLP 配方)、和规则拟合。更多内容将在以后继续添加。
一般来说,GBM 是最好的单次算法。自 2006 年以来,boosting 方法已被证明对于图像和声音模式识别之外的嘈杂预测建模任务是最准确的 ( https://www.cs.cornell.edu/~caruana/ctp/ct.papers/caruana.icml06 .pdf)。XGBoost 和 Kaggle 的出现只是巩固了这一地位。
有什么办法可以选择手动使用哪种算法?(在专家设置部分找到答案):
在某种程度上是的,您可以使用上面链接中描述的专家设置来选择您想要的算法。