我有一个大数据框,我在其中将两列相乘以获得另一列。起初我正在运行一个 for 循环,如下所示:
for(i in 1:nrow(df)){
df$new_column[i] <- df$column1[i] * df$column2[i]
}
但这需要9天。
另一种选择是plyr
,我实际上可能错误地使用了变量:
new_df <- ddply(df, .(column1,column2), transform, new_column = column1 * column2)
但这需要永远