我正在尝试检查受 n_estimators 影响的随机森林回归器性能。
seed = np.random.seed(1962)
rng = np.random.RandomState(1962)
np.random.seed(1962)
estimators = [pow(2,3),10,pow(2,4),pow(2,5),pow(2,6),pow(2,7),pow(2,8),500,pow(2,9),pow(2,10),pow(2,11)]
#oob_train = {}
train_acc = {}
test_acc = {}
for w in range(0,len(estimators),1):
modelrfe = RandomForestRegressor(n_estimators = estimators[w],random_state=rng, n_jobs = -1)
model_params = estimators[w]
modelrfe.fit(train_x1,train_y1)
train_acc[model_params] = mean_absolute_error(scale_data.inverse_transform(train_y1.reshape(-1,1)),scale_data.inverse_transform(modelrfe.predict(train_x1).reshape(-1,1)))
test_acc[model_params] = mean_absolute_error(scale_data.inverse_transform(test_y1.reshape(-1,1)),scale_data.inverse_transform(modelrfe.predict(test_x1).reshape(-1,1)))
train_acc = pd.DataFrame(train_acc.items())
train_acc.columns = ['keys','Trainerror']
test_acc = pd.DataFrame(test_acc.items())
test_acc.columns = ['keys','Testerror']
error_df3 = pd.merge(train_acc, test_acc, on='keys')
error_df3 = pd.DataFrame(error_df3)
这是不可重现的,我一开始也定义了 rng 。
注意:想象一个用于 1 的 For 循环:nrow(dataframe) 每个 1 它通过多个模型,并且我在 For 循环的开头定义了 rng 和 Seed 。
帮帮我!.
2 个样本输出,这应该是理想的。这里的键是指n_estimators
[在此处输入图像描述][模拟 1] [在此处输入图像描述][模拟 2]