python - 在循环内部或外部创建极其随机的树分类器

Question

我在 X_sample 中有许多样本矩阵 (mxn)。每个矩阵具有相同的行数（相同的 m），但具有不同的特征数（差异 n）。X-sample 中的矩阵示例为：1000x40、1000x35、1000x30、1000x25。关于我的问题，我有以下（非常简化的）代码示例：

Y_train =
Y_test =
clf = ExtraTreesClassifier(n_estimators=500, max_depth=None,max_features="auto",
                           min_samples_split=1, random_state=0)

for X_data in X_samples:
    X_train = X_data[0]
    X_test = X_data[1]
    clf.fit(X_train,Y_train)
    pred_res = clf.predict(X_test)
    .....

我使用参数在循环外创建了一个分类器max_features="auto"。我使用具有不同数量特征的样本矩阵在循环内执行不同的分类。我的问题是，max_features每次循环执行拟合操作时，分类器是否会根据 X_train 的实际大小（实际特征数）调整值。值为“auto”的参数 max_features应该得到等于特征数量平方根的实际值。也就是说，我应该在循环外还是在循环内创建分类器？有没有办法读取参数的实际值max_features？

score 1 · Accepted Answer

1

是的。该fit函数不会更改估计量。请参阅文档。

于 2012-12-01T11:37:25.390 回答

python - 在循环内部或外部创建极其随机的树分类器

1 回答 1

Related

Reference