2

我有以下格式的数据框,我想获得交叉表:

 T1   T2
 NN  NF
 FF  FF
 NF  FF
 NN  NN
 NN  FF
 NF  NF
 NF  NF
 FF  FF

我可以使用 table() 函数创建一个简单的交叉表

table(T1,T2) 这给了我以下输出:

   FF FN  NF  NN
FF  2  0   0   0 
FN  0  0   0   0 
NF  1  0   2   0 

但是,默认情况下会删除因子级别 NN。有没有办法可以保留表中的 NN 级别。表输出如下所示:

   FF FN  NF  NN
FF  2  0   0   0 
FN  0  0   0   0 
NF  1  0   2   0
NN  0  0   0   0  

编辑:

  dput(dataframe) gives: 

   structure(list(T1 = structure(c(3L, 1L, 2L, 3L, 3L, 2L), .Label = c("FF", 
   "NF", "NN"), class = "factor"), T2 = structure(c(2L, 1L, 1L, 
   3L, 1L, 2L), .Label = c("FF", "NF", "NN"), class = "factor")), .Names = c("T1", 
   "T2"), row.names = c(NA, 6L), class = "data.frame")
4

1 回答 1

2

问题是您的输入数据中没有列出“FN”。您可以通过调用levels()并通知 R 它您的关卡之一来解决此问题,它只是一个在您的数据集中没有任何观察的关卡。例如,

dframe <- read.table(text=" T1   T2
 NN  NF
 FF  FF
 NF  FF
 NN  NN
 NN  FF
 NF  NF
 NF  NF
 FF  FF", header=T)

levels(dframe$T1) <- c("FF", "NF", "NN", "FN")
levels(dframe$T2) <- c("FF", "NF", "NN", "FN")
with(dframe, table(T1,T2))
    T2
T1   FF NF NN FN
  FF  2  0  0  0
  NF  1  2  0  0
  NN  1  1  1  0
  FN  0  0  0  0

一个特别注意:您在这里覆盖了原始级别,因此您需要将新的、不存在的级别放在最后,否则 R 会将您的“NF”级别称为“FN”并导致各种问题。

于 2013-11-14T20:28:51.887 回答