我有预测变量列表和带有数据的 data.frame。我想做的是使用这个预测器并将它们的结果与一些聚合函数结合起来。我怎样才能做到这一点?
示例数据如下所示:
预测变量列表 p1 .. pn。(在我的情况下是树木)
每个预测变量返回两列:给定行的“分类概率”和“1 - 分类概率”。
我想对每个预测器返回的“分类概率”求和,并将其与“1 - 分类概率”的总和进行比较。
样本数据:
library('rpart');
size = 10;
samplesize=100;
mydata=data.frame(age=sample(10:40, samplesize, replace=TRUE), weight=rnorm(samplesize, mean = 60, sd = 20), girth=rnorm(samplesize, mean = 60, sd = 20))
mydata=cbind(mydata, dec=((mydata$weight > 40) | (mydata$girth > 60)))
attributes = colnames(mydata)[1:length(colnames(mydata)) - 1]
model <- list();
for(i in 1:size) {
attr = sample(1:length(attributes), sample(1:length(attributes)));
fmla <- as.formula(paste("dec ~ ", paste(attributes[attr], collapse= "+")));
tree <- rpart(fmla, data=mydata, method="class", control=model$rc);
model[[i]] <- tree;
}
其中 model 是预测变量列表,mydata 是实际数据。我现在可以预测:
predict(model[[1]], mydata)
选择
我在这里无法实现的主要事情是聚合函数的结果。我可以在这里给出我有功能的更简单的情况:
f <- function (x, n) {
data.frame(first = x + n, second=x * n);
}
并希望获得结果列的总和以及列first
中值的总和second
(对于非全局的每一行)以进行以下调用:
f(1:4, 2)
f(1:4, 3)
..
f(1:4, n)