0

我已阅读http://dplyr.tidyverse.org/articles/programming.html关于 dplyr 中的非标准评估,但仍然无法正常工作。

plot_column <- “columnA”

raw_data %>%
    group_by(.dots = plot_column) %>%
    summarise (percentage = mean(columnB)) %>%
    filter(percentage > 0) %>%
    arrange(percentage) %>%
    # mutate(!!plot_column := factor(!!plot_column, !!plot_column))%>%
    ggplot() + aes_string(x=plot_column, y="percentage")  +
  geom_bar(stat="identity", width = 0.5) +
  coord_flip()

当 mutate 语句被禁用时工作正常。但是,当启用它以便按高度对条进行排序时,只会返回一个条。

如何将上面的语句转换为函数 / 以使用变量但仍绘制按大小排序的多个条形图。

一个示例数据集可以是:

columnA,columnB
a, 1
a, 0.4
a, 0.3
b, 0.5

编辑

一个样品:

mtcars %>%
  group_by(mpg) %>%
  summarise (mean_col = mean(cyl)) %>%
  filter(mean_col > 0) %>%
  arrange(mean_col) %>%
  mutate(mpg := factor(mpg, mpg))%>%
    ggplot() + aes(x=mpg, y=mean_col)  +
  geom_bar(stat="identity")
  coord_flip()

将输出一个有序的条形图。如何将其包装到可以替换列并获得多个条形的函数中?

4

1 回答 1

2

这适用于 dplyr 0.7.0 和 ggplot 2.2.1:

rm(list = ls())
library(ggplot2)
library(dplyr)
raw_data <- tibble(columnA = c("a", "a", "b", "b"), columnB = c(1, 0.4, 0.3, 0.5))

plot_col <- function(df, plot_column, val_column){

  pc <- enquo(plot_column)
  vc <- enquo(val_column)
  pc_name <- quo_name(pc) # generate a name from the enquoted statement!

  df <- df %>%
   group_by(!!pc) %>%
   summarise (percentage = mean(!!vc)) %>%
   filter(percentage > 0) %>%
   arrange(percentage) %>%
   mutate(!!pc_name := factor(!!pc, !!pc)) # insert pc_name here!

  ggplot(df) + aes_(y = ~percentage, x = substitute(plot_column)) +
    geom_bar(stat="identity", width = 0.5) +
    coord_flip()
}
plot_col(raw_data, columnA, columnB)
plot_col(mtcars, mpg, cyl)

我遇到的问题是 ggplot 和 dplyr 使用不同类型的非标准评估。我在这个问题上得到了答案:使用 ggplot2 创建函数

编辑:参数化值列(例如 columnB/cyl)并添加 mtcars 示例。

于 2017-08-03T08:21:27.790 回答