3

xtabs用来将一些包含NAs 的数据制成表格。为了确保总数是完整的,我addNA用来计算缺少因子水平的那些。

但是,当使用xtable导出到 LaTeX 进行 Sweaving 时,这会导致问题,因为现在NA行名和列名中有 s。我有一个解决方案:

rownames(tab)[is.na(rownames(tab))]<-"NA"
colnames(tab)[is.na(colnames(tab))]<-"NA"

但这对于很多表来说可能会变得很烦人,有没有办法更自动地做到这一点?或者有没有更好的方法来制作表格?

4

2 回答 2

6

有趣的问题。我也找不到使用 xtable 本身来处理这个问题的方法。所以我能建议的最好的方法是将你的解决方法变成一个可以轻松调用的小函数。

例如:

# Construct some data
df <- data.frame(
  x1 = addNA(sample(c(NA, LETTERS[1:4]), 100, replace = TRUE)),
  x2 = addNA(sample(c(NA, letters[24:26]), 100, replace = TRUE))
)

# Create a function to rename NA row and column names in a data.frame
rename_NA <- function(x){
  rownames(x)[is.na(rownames(x))] <- "NA"
  colnames(x)[is.na(colnames(x))] <- "NA"
  x
}

tab <- rename_NA(xtabs(~x1+x2, data=df))
xtable(tab)

这将创建没有错误的有效乳胶:

% latex table generated in R 2.13.0 by xtable 1.5-6 package
% Wed Apr 27 17:20:21 2011
\begin{table}[ht]
\begin{center}
\begin{tabular}{rrrrr}
  \hline
 & x & y & z & NA \\ 
  \hline
A & 4.00 & 7.00 & 10.00 & 4.00 \\ 
  B & 6.00 & 5.00 & 4.00 & 2.00 \\ 
  C & 8.00 & 4.00 & 4.00 & 2.00 \\ 
  D & 8.00 & 5.00 & 1.00 & 6.00 \\ 
  NA & 5.00 & 2.00 & 7.00 & 6.00 \\ 
   \hline
\end{tabular}
\end{center}
\end{table}
于 2011-04-27T16:23:38.490 回答
2

要考虑的另一个解决方案是使用 modifiedaddNA以允许它首先将因子级别输出为字符串:

addNA2 <- function (x, ifany = FALSE, as.string = TRUE)
{
    if (!is.factor(x)) 
        x <- factor(x)
    if (ifany & !any(is.na(x))) 
        return(x)
    ll <- levels(x)
    if (!any(is.na(ll))) 
        ll <- c(ll, NA)
    x <- factor(x, levels = ll, exclude = NULL)
    if(as.string) levels(x)[is.na(levels(x))] <- "NA"
    x
}
于 2011-04-28T10:28:43.490 回答