我刚刚发现了这个,我有兴趣探索使用 SQL 存储来计算我的一些学习器输出。我认为数据库调用可能比基本 R 或 Python 快得多。
很棒的小插图: http ://cran.nexr.com/web/packages/tidypredict/vignettes/randomForest.html
基本代码:
require(pacman)
p_load(randomForest, tidypredict, dbplyr)
model <- randomForest(Species ~ .,data = iris ,ntree = 10, proximity = TRUE)
tidypredict_sql(model, dbplyr::simulate_mssql())
它为每棵树提供了 SQL 代码,然后我可以使用该模式聚合这些代码以获得估算器输出。
那么如何将它与 h2o.ai 之类的东西一起使用,尤其是 h2o.randomForest 之类的东西呢?