所以我在网上生成了一个随机数据集,我需要在上面应用 C4.5 算法。
我安装了 RWeka 包及其所有依赖项,但我不知道如何执行它。
有人可以帮我提供教程的链接吗?除了 RWeka 文档之外的任何内容。还是 R 中的示例 C4.5 代码以了解其工作原理?
谢谢
问问题
4264 次
1 回答
5
我认为值得您花时间检查一下caret
包裹。它标准化了 R 中大多数机器学习包的语法,包括RWeka
.
它还有很多非常有用的辅助功能和他们网站上的一个很棒的教程
RWeka
以下是使用带有 C4.5 类树的包预测 iris 数据集上的物种的语法:
library(caret)
train_rows <- createDataPartition(iris$Species, list=FALSE)
train_set <- iris[train_rows, ]
test_set <- iris[-train_rows, ]
fit.rweka <- train(Species ~ ., data=train_set, method='J48')
pred <- predict(fit.rweka, newdata=test_set)
然后,如果您想尝试梯度提升机或其他算法,只需更改为method='gbm'
于 2015-11-12T15:35:35.607 回答