下面的脚本说明了我的问题:
library(reshape2)
set.seed(1)
dummy.df <- data.frame(var_a=sample(letters[1:5],200,replace=TRUE),
var_b=sample(1:5,200,replace=TRUE),
stringsAsFactors=FALSE)
temp1 <- addmargins(table(dummy.df[,c("var_a","var_b")]),1)
temp2 <- formatC(addmargins(prop.table(table(dummy.df[,c("var_a","var_b")]),2),1)*100,digits=2,format="f")
temp1.melt <- melt(temp1,id.vars="var_a")
temp2.melt <- melt(temp2,id.vars="var_a")
temp.output <- merge(temp1.melt,temp2.melt,by=c("var_a","var_b"))
temp.output[,"value"] <- paste(temp.output[,"value.x"]," (",temp.output[,"value.y"],"%)",sep="")
temp.output[,"var_a"] <- factor(temp.output[,"var_a"],levels=c("a","b","c","d","e","Sum"))
temp.output <- dcast(temp.output,formula=var_a~var_b,value.var="value")
我在办公室的一项日常工作是创建列出不同变量之间频率的表格,通常我也会在表格中包含百分比(行/列百分比)。
在我知道函数addmargins
,prop.table
和之前as.data.frame.matrix
,我使用了很多melt
和dcast
fromreshape2
包来解决问题(即将表格转换为数据框,melt
然后进行适当的除法以给出百分比dcast
)。现在我知道使用三个新的学习函数可以为我节省很多代码。
现在我想知道这是否可以提前一步,而不使用我上面提供的脚本,并创建一个在实际计数旁边显示行/列百分比的表?