对不起,如果这个问题有点特定于 python Scikit-learn库。
我正在尝试执行网格搜索以找到 scikit-learn 的GradientBoostingRegressor的最佳参数。问题是,我不知道从哪里开始。过去我使用过 R 和 RStudio 设置,但我现在正试图迁移到 Python 进行数据挖掘,而 Scikit 似乎很有希望。
任何人都可以分享一些他们可能用于在 Amazon EC2 集群上计算的简单设置代码,或者可能指向该库的有用示例参考以用于其他机器学习算法吗?
谢谢你。