0

我发现了一个问题,我无法理解。有人可以指出一个解释吗?

在 ggplot 中,如果我使用/不使用带有变量名的“$”,它会给出不同的结果。请看下面的例子,

library(ggplot2)
df <- read.csv("pseudo_facebook.tsv", sep = '\t')

# Without $ sign
ggplot(data = df, aes(x = friend_count)) + geom_histogram(binwidth = 25) +
  scale_x_continuous(limits = c(1, 1000), breaks = seq(0, 1000, 25)) + 
  facet_grid(~df$gender)

变量名中没有 $

# With $ sign
ggplot(data = df, aes(x = df$friend_count)) + geom_histogram(binwidth = 25) +
  scale_x_continuous(limits = c(1, 1000), breaks = seq(0, 1000, 25)) + 
  facet_grid(~df$gender)

在此处输入图像描述

4

1 回答 1

0

我不确定这是否是导致您行为的原因,但在第一个示例中,您仍然df$facet_grid公式中。如果您将裸列名与数据框指定的列名混合在一起,则可能会出现一些偷偷摸摸的评估问题。

如果您read.csv使用 URL 切换该文件名,您将拥有一个我可以测试的代表

于 2017-12-17T22:42:55.383 回答