2

我正在尝试按因子计算分位数并使用 xtable 将结果聚合打印为乳胶格式。不幸的是,我的行为有些古怪。一个干净的解决方案将不胜感激。

创建示例:

tm <- data.frame(f=c("a","b","c"),v=runif(30))
tm$f <- factor(tm$f)
agv <- aggregate(v~f,tm, quantile)

agvxtable 不接受输出:

xtable(agv)

cols[, i + pos] <- do.call("formatC", curFormatArgs) 中的错误:要替换的项目数不是替换长度的倍数

即使print(agv)

  f        v.0%       v.25%       v.50%       v.75%      v.100%
1 1 0.002970944 0.253247687 0.571891610 0.766606825 0.986142807
2 2 0.002129951 0.328739086 0.558132094 0.799115979 0.991067470
3 3 0.011059184 0.285322522 0.496035672 0.770908599 0.994420787

因为显然dim(agv)是实际上[1] 3 2

所以我尝试了:

cbind(featureName=agv$f, agv$v)

由于某种原因,这导致字符因子转换为数值。

经过反复试验,这是我确定的解决方案:

cbind(f=as.character(agv$f), data.frame(agv$v,check.names=F))

这给了我想要的结果xtable

\begin{table}[ht]
\centering
\begin{tabular}{rlrrrrr}
  \hline
 & f & 0\% & 25\% & 50\% & 75\% & 100\% \\
  \hline
1 & a & 0.00 & 0.25 & 0.48 & 0.75 & 0.99 \\
  2 & b & 0.00 & 0.28 & 0.46 & 0.74 & 1.00 \\
  3 & c & 0.02 & 0.21 & 0.44 & 0.63 & 1.00 \\
   \hline
\end{tabular}
\end{table}

无论如何,我只是好奇是否有一个涉及更少线路的更清洁的解决方案。

4

1 回答 1

3

一种稍微更直接的方法(尽管在概念上与您已经完成的方法没有太大不同)可能是使用do.call(data.frame, ...). 以下对我有用。

xtable(do.call(data.frame, c(agv, check.names = FALSE)))

对我来说,返回:

> xtable(do.call(data.frame, c(agv, check.names = FALSE)))
% latex table generated in R 3.0.0 by xtable 1.7-1 package
% Thu Apr 25 11:10:26 2013
\begin{table}[ht]
\centering
\begin{tabular}{rlrrrrr}
  \hline
 & f & v.0\% & v.25\% & v.50\% & v.75\% & v.100\% \\ 
  \hline
1 & a & 0.06 & 0.27 & 0.38 & 0.64 & 0.94 \\ 
  2 & b & 0.20 & 0.38 & 0.52 & 0.70 & 0.87 \\ 
  3 & c & 0.01 & 0.22 & 0.60 & 0.87 & 0.99 \\ 
   \hline
\end{tabular}
\end{table}

xtable也适用于data.tables,因此您还可以执行以下操作:

library(data.table)

DT <- data.table(tm, key = "f")
xtable(DT[, as.list(quantile(v)), by = key(DT)])

在这里,DT[, as.list(quantile(v)), by = key(DT)]将为您提供与“agv”对象相同的结果。

于 2013-04-25T05:41:51.070 回答