2

tbl_summary [library (gtsummary)] 不会以相同的方式处理所有数值变量,我不知道如何更改它。例如。

mtcars 只有数字变量,所以当我运行它时,我希望计算每个变量的平均值。相反,它将 cyl、gear 和 carb 视为分类。

tbl_summary(mtcars, statistic = list(all_numeric() ~ "{mean} ({sd})",
                                      all_categorical() ~ "{n} / {N} ({p}%)"))

我实际上有一个更大的数据集,并且 tbl_summary 将一些数字变量视为分类变量。会不会是因为 N 太少(假设我有很多缺失的行)并且 tbl_summary 不想计算如此小的 N 的平均值?

我不能把我的想法包裹起来!

只是我的数据中的另一个例子。Q12_5_TEXT 是一个数值变量,但这是 tbl_summary 的输出。

在此处输入图像描述

4

3 回答 3

2

我试过 type = all_continuous() ~ "continuous2",我的版本是 1.3.5,它并没有改变摘要类型:

library(tidyverse)
library(gtsummary)

nrows <- 30

df <- tibble(
  a = sample(c(0,1,3.5,7.5),nrows,replace = T),
  b = sample(c("Group I","Group II"),nrows,replace = T)
)

df %>% 
  tbl_summary(
    by = b,
    type = all_continuous() ~ "continuous2",
    statistic = all_continuous() ~ "{mean} ({sd})"
  )

尽管有类型参数,但此汇总变量“a”的输出就好像它是分类变量一样。我也遇到了这个问题,这就是我来这里寻求答案的原因。如果我应该使用不同的论点,您可以指出我,我将不胜感激!

于 2021-01-21T01:22:56.673 回答
1

对具有很少唯一级别的变量进行了分类汇总。例如,mtcars$cyl只有三个唯一级别:4、6、8。只有三个级别,分类汇总比平均值或中位数更合适。

使用type=参数更改默认摘要类型。

于 2020-09-24T00:43:49.953 回答
1

我有同样的问题,我通过告诉 tbl_summary 分类变量实际上是连续的来解决它。尝试:

df %>% 
  tbl_summary(
    by = b,
    type = list(all_continuous() ~ "continuous2",
                          all_categorical() ~ "continuous2"),
    statistic = all_continuous() ~ "{mean} ({sd})"
  )
于 2022-01-31T23:02:26.090 回答