0

我非常喜欢 R 的简单函数,比如 table(),用于快速查看双变量表,但是当我想要在同一输出中出现频率和百分比时,我使用 summarytools 包中的 ctable()。

有时我有很长的变量名,这对 table() 没有问题;我只是在 table() 函数中快速重命名。但是,我还没有弄清楚如何为 ctable() 输出进行相同类型的变量标签重命名。我在 SO 上找到了一些关于 ctable() 和标签的帖子,但这些帖子涉及其他更复杂的工作,例如涉及 kable() 和 Rmarkdown。我希望将所有内容都隐藏在原始控制台输出中,最好全部在 ctable() 中,或者可能嵌套在另一个函数中,如 print()。

这是我想做的事情以及到目前为止我遇到的问题的代码示例。

# load packages
library(summarytools)
# load example data - actual values don't matter here
data("mtcars")
# copy a variable so it has a long name
mtcars$really_long_variable_name_for_vs <- mtcars$vs

这是一个简单的 table() 输出示例。

没有标签的丑陋:table(mtcars$gear, mtcars$really_long_variable_name_for_vs)

   0  1
3 12  3
4  2 10
5  4  1

易于添加行和列名称:table("gear"=mtcars$gear, "vs"=mtcars$really_long_variable_name_for_vs))

    vs  
gear  0  1
   3 12  3
   4  2 10
   5  4  1

但是我知道的ctable() 并不是那么简单

丑陋的长列名将输出推到右边:ctable(mtcars$gear, mtcars$really_long_variable_name_for_vs)

Cross-Tabulation, Row Proportions  
gear * really_long_variable_name_for_vs  
Data Frame: mtcars  

------- ---------------------------------- ------------ ------------ -------------
          really_long_variable_name_for_vs            0            1         Total
   gear                                                                           
      3                                      12 (80.0%)    3 (20.0%)   15 (100.0%)
      4                                       2 (16.7%)   10 (83.3%)   12 (100.0%)
      5                                       4 (80.0%)    1 (20.0%)    5 (100.0%)
  Total                                      18 (56.2%)   14 (43.8%)   32 (100.0%)
------- ---------------------------------- ------------ ------------ -------------

尝试像 table() 一样重命名是行不通的。 ctable("gear"=mtcars$gear, "vs"=mtcars$really_long_variable_name_for_vs)这会产生以下错误。

Error in ctable(gear = mtcars$gear, vs = mtcars$really_long_variable_name_for_vs) : argument "x" is missing, with no default

我了解缺少给定 ctable() 参数要求的“x”,但不了解如何重命名输出中的 x 和 y 名称。summarytools 包小插图(此处)显示使用 freq() 和 print() 重新标记变量,但是当我尝试像这样的 ctable() 的几个版本时,它并没有很好地工作:print(ctable(x=mtcars$gear, y=mtcars$really_long_variable_name_for_vs), Variable.label=c("RowVar","ColVar"))它给出了相同的输出多于。

我想要的输出是这样的:

    Cross-Tabulation, Row Proportions  
gear * mtcars$really_long_variable_name_for_vs  
Data Frame: mtcars  

------- -- ----------- -----------  ------------
        vs          0            1         Total
   gear                                                                           
      3     12 (80.0%)    3 (20.0%)   15 (100.0%)
      4      2 (16.7%)   10 (83.3%)   12 (100.0%)
      5      4 (80.0%)    1 (20.0%)    5 (100.0%)
  Total     18 (56.2%)   14 (43.8%)   32 (100.0%)
------- -- ----------- ------------ -------------

我在这里想念什么?提前致谢!

4

1 回答 1

2

使用dnn

library(summarytools)

ctable(mtcars$gear,mtcars$really_long_variable_name_for_vs,dnn = c('gear', 'vs'))

#Cross-Tabulation, Row Proportions  
#gear * vs  
#Data Frame: mtcars  

#------- ---- ------------ ------------ -------------
#          vs            0            1         Total
#   gear                                             
#      3        12 (80.0%)    3 (20.0%)   15 (100.0%)
#      4         2 (16.7%)   10 (83.3%)   12 (100.0%)
#      5         4 (80.0%)    1 (20.0%)    5 (100.0%)
#  Total        18 (56.2%)   14 (43.8%)   32 (100.0%)
#------- ---- ------------ ------------ -------------
于 2021-04-15T07:36:36.920 回答