python - 什么是使用随机搜索调整超参数的最佳参数分布

翻译自：https://stackoverflow.com/questions/43823240 2017-05-06T17:13:17.237

213 次

SK-learn 的机器学习算法需要大量参数，我很难找出应该为随机搜索调整算法分配哪个间隔。我目前使用 7 种不同的 ML 算法（SVM、LDA、LR、DT、GBC、KNN），但让我们以随机森林为例。

X, y = df.something().....
from sklearn.ensemble import RandomForestClassifier
    param_dist = {"criterion": ["gini", "entropy"],
                   "max_features": ['auto', 'sqrt', 'log2'],
                   "max_depth": randint(1, 100),
                   "min_samples_split": randint(2, 150),
                   "min_samples_leaf": randint(1, 150),
                   "max_leaf_nodes": randint(2, 100),
                   "n_estimators": randint(2, 200)}
    model = RandomForestClassifier()
    ts_rs = run_randomsearch(X, y, model, param_dist, cv=5, n_iter_search=100)

总体：如何分配最佳参数分布以进行搜索？ 更具体地说：我如何确定在 [1:10000] 中搜索最大深度是否更好，而不是说；[1:10]？任何人都可以推荐任何最佳选择吗？（甚至可能有来源）目前，这是我得到的最接近的：How to tune parameters in Random Forest, using Scikit Learn？

python - 什么是使用随机搜索调整超参数的最佳参数分布

0 回答 0

Related

Reference