我正在尝试 qwraps2 包及其一些功能。特别是我对用于输出的 summary_table 工具感兴趣。我正在使用 iris 数据集进行练习,但在 summary_table 中使用 group_by 时发现了一些奇怪的现象:
library(datasets)
data("iris")
options(qwraps2_markup = "markdown")
our_summary1 <-
list("Sepal Length" =
list("min" = ~ min(iris$Sepal.Length),
"max" = ~ max(iris$Sepal.Length),
"mean (sd)" = ~ qwraps2::mean_sd(iris$Sepal.Length)),
"Sepal Width" =
list("min" = ~ min(iris$Sepal.Width),
"median" = ~ median(iris$Sepal.Width),
"max" = ~ max(iris$Sepal.Width),
"mean (sd)" = ~ qwraps2::mean_sd(iris$Sepal.Width)),
"Petal Length" =
list("min" = ~ min(iris$Petal.Length),
"max" = ~ max(iris$Petal.Length),
"mean (sd)" = ~ qwraps2::mean_sd(iris$Sepal.Length)),
"Petal Width" =
list("min" = ~ min(iris$Petal.Width),
"max" = ~ max(iris$Petal.Width),
"mean (sd)" = ~ qwraps2::mean_sd(iris$Petal.Width)),
"Species" =
list("Setosa" = ~ qwraps2::n_perc0(iris$Species == "setosa"),
"Versicolor" = ~ qwraps2::n_perc0(iris$Species == "versicolor"),
"Virginica" = ~ qwraps2::n_perc0(iris$Species == "virginica"))
)
bytype <- qwraps2::summary_table(dplyr::group_by(iris,Species),our_summary1)
bytype
我得到的输出是: 上述代码的输出
这没有意义,它说不同花种的不同变量的统计数据是相同的,但事实并非如此。我通过这样做交叉检查了这一点:
aggregate(iris[1:4], list(iris$Species), mean)
这表明,例如,不同变量的平均值因物种而异。
为什么dplyr::group_by
不做应该做的事?
我尽我所能发布了输出,对不起,谢谢你的理解。