Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
1)随机森林是否需要标准化?
2)应该对所有特征进行归一化还是仅对数字特征进行归一化?
3)在拆分为训练数据和测试数据之前或之后进行归一化是否重要?
4)我是否需要对将被分类的未来对象的特征进行预处理?(接受模型后,不是在测试期间)
1)不!任何基于树的分类器都不需要特征归一化。
2)一般来说,应该对所有特征进行归一化,而不仅仅是数字特征。
3)在实践中并没有太大的区别。但是,正确的做法是从训练集中识别每个特征的最小值和最大值,然后根据这些值对这两个集合的特征进行归一化。
4)是的,之后任何需要分类的样本都应该以与训练期间完全相同的方式进行处理。