我正在尝试开始使用机器学习。
我有一些训练数据表示图像中数字的像素值,我正在尝试从中训练决策树。什么是开始的好方法?我应该考虑哪些工具(相关文档的指针会有所帮助)?
我还想在数据上训练一个随机森林来比较性能与决策树。任何指导都会有很大帮助。
我正在尝试开始使用机器学习。
我有一些训练数据表示图像中数字的像素值,我正在尝试从中训练决策树。什么是开始的好方法?我应该考虑哪些工具(相关文档的指针会有所帮助)?
我还想在数据上训练一个随机森林来比较性能与决策树。任何指导都会有很大帮助。
最好的入门方法可能是Weka。除了提供随机森林分类器和几个决策树(在许多其他算法中)的实现之外,它还提供了用于处理和可视化数据的工具。它带有一个相对易于使用的 GUI。
随机森林使用树木,所以我可能会建议您先让树木工作。一旦您了解了所有关于树木的知识,您就可以阅读有关森林的信息,这将非常简单。但是,您应该从尝试学习机器学习开始,而不仅仅是跳入图书馆。我将首先了解如何使用最大化熵的方法在布尔特征上使用决策树(简单得多)。一旦你充分理解了该算法,可以在一个小数据集上手动运行它,请阅读如何在真正有价值的特征上使用决策树。然后去图书馆看看。