1

我遇到了这个例子,它涉及完成测试数据集的人脸。这里,一个 for 的值32max_features传递给ExtraTreesRegressor()函数。我了解到决策树是构建的,它从输入数据集中选择随机特征。对于上述链接中的示例,图像用作训练和测试数据集。这个 wiki 页面描述了各种类型的图像特征。现在我无法理解sklearn.ensemble.ExtraTreeRegressor从作为输入提供的图像数据集中寻找或提取哪些特征来构建随机森林。此外,如何确定 的值对于32是最佳的max_features。请帮我解决一下这个。

4

3 回答 3

6

随机森林不进行特征提取。他们使用提供给他们的数据集中的特征,在这个例子中,这些特征只是来自 Olivetti 人脸数据集的像素强度。

an的max_features参数ExtraTreesRegressor确定“在寻找最佳分割时要考虑的特征数量”(在森林采用的决策树学习算法中)。

值 32 可能是根据经验确定的。

于 2013-06-11T15:57:05.190 回答
6

这里使用的特征是原始像素值。由于数据集中的图像是对齐的并且非常相似,这似乎足以完成这项任务。

于 2013-06-11T16:03:04.590 回答
2

正如其他人所说:在这个简单的例子中,没有特征提取:额外的树只是使用原始像素作为特征。

在更现实的计算机视觉设置中,执行手动调整的特征提取很可能会产生更有趣的模型。要提取的特征类型取决于您想要实现的计算机视觉任务。阅读 OpenCV 库中的文献或示例,了解计算机视觉的最新技术(暂时将基于神经网络的表示学习作为前沿研究放在一边)。

参数的 32 值可以随机搜索。有关示例,请参见 master 分支中的此示例:

http://scikit-learn.org/dev/auto_examples/randomized_search.html#example-randomized-search-py

于 2013-06-11T16:17:58.110 回答