0

我刚刚在ggplot2中找到了facet_grid函数,太棒了。问题是:我有一个包含 6 个国家(HC 列)和全球航班目的地的列表。我的数据如下所示:

           HC Reason Destination  freq       Perc
        <chr>  <chr>       <chr> <int>      <dbl>
 1    Germany  Study     Germany     9  0.3651116
 2    Germany   Work     Germany     3  0.1488095
 3    Germany Others     Germany     3  0.4901961
 4    Hungary  Study     Germany   105 21.4285714
 5    Hungary   Work     Germany   118 17.6382661
 6    Hungary Others     Germany    24  5.0955414
 7 Luxembourg  Study     Germany   362 31.5056571

有没有办法在每个国家只显示前十名目的地并使用函数 facet_grid?我试图以这种方式制作散点图:

Geograp %>% 
  gather(key=Destination, value=freq, -Reason, -Qcountry) %>%
  rename(HC = Qcountry) %>%
  group_by(HC,Reason) %>%
  mutate(Perc=freq*100/sum(freq)) %>%
  ggplot(aes(x=Perc, y=reorder(Destination,Perc))) +
  geom_point(size=3) +
  theme_bw() +
  facet_grid(HC~Reason) +
  theme(panel.grid.major.x = element_blank(),
        panel.grid.minor.x = element_blank(),
        panel.grid.major.y = element_line(colour = "grey60", linetype = "dashed"))

生成此图:在此处输入图像描述我想避免在 y 轴上过度绘制。提前致谢!!!

4

2 回答 2

2

您可以创建一个变量,按国家/地区指示每个目的地的排名,然后在 ggplot 调用中选择排名 <= 10 的行,例如

ggplot(data = mydata[rank <= 10, ], ....)

PS:目前您使用管道在一行中创建数据和绘制数据。我会将数据创建和绘图步骤分开。

于 2017-08-01T07:42:08.577 回答
0

由于您没有以正确的格式发布您的数据(签出dput()),我只使用了一个示例数据。使用dplyr包 i 在这种情况下按 grp 变量(group_by(grp),在您的情况下是一个国家/地区)分组并选择前 10 行(...top_n(n = 10,...),这些行按 x 变量(wt = x,在您的情况下为freq)排序并进一步绘制(就在本例散点图):

library(dplyr)
set.seed(123)
d <- data.frame(x   = runif(90),grp = gl(3, 30))

d %>%
group_by(grp) %>%
top_n(n = 10, wt = x) %>%
ggplot(aes(x=x, y=grp)) + geom_point()
于 2017-08-01T07:40:17.030 回答