4

是否有一种简单的方法可以在“堆叠”条形图中标记单个“块”,如下所示。我希望标签位于每个块的顶部附近,但我最新的方法导致以某种方式将文本交换为美国和墨西哥,如下所示。

条形图示例

环顾四周寻找解决方案,我只找到y了必须在外部预先计算文本值的方法,除了额外的逻辑之外,这带来了控制块堆叠顺序的问题......
我还发现了这个stackoverflow 问题,在那里我有了在 a 中使用 a 的想法geom="text"stat_bin 见下面的代码)
这是一个精简的代码片段,用于说明我当前的方法。我不一定要修复这个片段,任何标记堆栈条形图区域的通用习语都可以!
编辑:(鉴于这个问题到目前为止得到的两个答案)
我想强调的是,我宁愿选择不意味着预先计算的解决方案文本的 y 位置

# sample data source
df.StackData <- data.frame(
    QType = c("A4-1", "A4-1", "A4-1",  "B3", "B3", "B3"),
    Country = c("Canada", "USA", "Mexico", "Canada", "USA", "Mexico"),
    NbOfCases = c(1000, 1320, 380, 400, 1000, 812),
    AvgRate = c(17.2, 11.4, 44.21, 17.3, 15.3, 39.7),
    Comment = c("Can", "US", "Mex", "Can", "US", "Mex")
)

和 ggplot 调用。它产生了上面显示的图表,带有奇怪的标签交换(还有一个额外的图例,'虽然这个图例问题很容易处理;我只是在准备这个问题时注意到它)。

ggplot(data=df.StackData,
       aes(x=QType, y=NbOfCases, fill=Country))+
  geom_bar(stat="identity", width=1) +
  stat_bin(geom="text", aes(label=paste("R coef =",
                                        formatC(AvgRate, format="f", digits=3),
                                        "(", Comment, ")" ),
                            vjust=1.5, size=3 
                        )
  )

我最初的尝试如下向图中添加了 geom_text() ,但当然 y 值是错误的(将文本相对于图的最底部而不是单个块的底部)...

  ... +
  geom_text(mapping=aes(x=QType, y=NbOfCases, 
                        label=paste("R coef =",
                                    formatC(AvgRate, format="f", digits=3),
                                    "(", Comment, ")" ),
                         vjust=1.5),
            size=3)
4

4 回答 4

2

这是一个解决方案。这里有两件事。首先,您应该将您reorder的级别与您data.frame在数据中的顺序相同df.StackData。其次,创建另一个通过计算数据的累积和来计算data.framey-position

# reorder levels of factor to the same order as found in data
df.StackData$Country <- factor(df.StackData$Country, 
          levels=c("Canada", "USA", "Mexico"), ordered=TRUE)
p <- ggplot(data=df.StackData, aes(x=QType, fill=Country))
p <- p + geom_bar(aes(weights=NbOfCases))

# compute corresponding y-axis positions by cumulative sum
require(plyr)
df <- ddply(df.StackData, .(QType), function(x) {
    x$NbOfCases <- cumsum(x$NbOfCases)
    x
})

# then use geom_text with data = df (the newly created data)
p + geom_text(data = df,  aes(x=QType, y=NbOfCases, 
        label=paste("R coef =", 
        formatC(AvgRate, format="f", digits=3), 
        "(", Comment, ")" ), vjust=1.5), size=3)

在此处输入图像描述

编辑:如果您不想自己计算 y-pos,那么您必须使用stat_bin. 只需重新排序列的级别,Country它就可以工作:

# data
df.StackData <- data.frame(
    QType = c("A4-1", "A4-1", "A4-1",  "B3", "B3", "B3"),
    Country = c("Canada", "USA", "Mexico", "Canada", "USA", "Mexico"),
    NbOfCases = c(1000, 1320, 380, 400, 1000, 812),
    AvgRate = c(17.2, 11.4, 44.21, 17.3, 15.3, 39.7),
    Comment = c("Can", "US", "Mex", "Can", "US", "Mex")
)

# just add this: reorder the level 
df.StackData$Country <- factor(df.StackData$Country, 
          levels=c("Canada", "USA", "Mexico"), ordered=TRUE)

# your code again using stat_bin (just changed the width to 0.75)
ggplot(data=df.StackData,
       aes(x=QType, y=NbOfCases, fill=Country))+
  geom_bar(stat="identity", width=.75) +
  stat_bin(geom="text", size=4, aes(label=paste("R coef =",
                                        formatC(AvgRate, format="f", digits=3),
                                        "(", Comment, ")" ),
                            vjust=1.5))

在此处输入图像描述

于 2013-03-14T20:50:53.580 回答
2

这是一个解决方案

df2 = ddply(df.StackData, .(QType), transform, 
 pos = cumsum(NbOfCases) - 0.5 * NbOfCases)

ggplot(data = df2, aes(x = QType, y = NbOfCases, fill = Country)) +
  geom_bar(stat = "identity") +
  geom_text(aes(y = pos, label = paste("R coef =", 
   formatC(AvgRate, format="f", digits=3), "(", Comment, ")" ))
  )

伊姆古尔

于 2013-03-14T20:56:41.953 回答
1

这是另一种选择 - 因为默认情况下您的因子将按字母顺序排序,所以我建议重新排序您的数据框以匹配此,而不是重新排序因子以匹配数据框的顺序。在我看来,这将允许一个更通用的解决方案。你得到一个你不想要的图例的唯一原因是你里面有大小aes- 我已经在下面修复了。

使用您的数据:

df.StackData <- with(df.StackData, df.StackData[order(Country),])

然后您可以将原始解决方案与stat_bin. 我用一些更复杂的数据集对其进行了测试,以检查它是否有效:

df.StackData <- data.frame(
  QType = rep(c("A4-1","B3"), each = 6),
  Country = rep(c("Canada", "USA", "Mexico", "UK", "Sweden", "Australia"), times = 2),
  NbOfCases = c(1000, 1320, 380, 400, 1000, 812, 542, 531, 674, 328, 795, 721),
  AvgRate = c(17.2, 11.4, 44.21, 17.3, 15.3, 39.7, 21.1, 25.3, 24.1, 31.3, 38.4, 36.1),
  Comment = rep(c("Can", "US", "Mex", "UK", "Aus", "Swe"), times = 2)
)

不排序:

ggplot(data=df.StackData,
       aes(x=QType, y=NbOfCases, fill=Country))+
  geom_bar(stat="identity", width=1) +
  stat_bin(geom="text", aes(label=paste("R coef =", formatC(AvgRate, format="f", digits=3),
"(", Comment, ")" ),  vjust = 1),size=3)
geom_text(aes(label = Comment), stat="identity")

在此处输入图像描述

排序后:

df.StackData <- with(df.StackData, df.StackData[order(Country),])

在此处输入图像描述

于 2013-03-14T23:46:00.460 回答
1

为了删除额外的图例,您可以使用show_guide=FALSE. 在您的示例中:

ggplot(data=df.StackData,
       aes(x=QType, y=NbOfCases, fill=Country))+
  geom_bar(stat="identity", width=.75) +
  stat_bin(geom="text", size=4, aes(label=paste("R coef =",
                                        formatC(AvgRate, format="f", digits=3),
                                        "(", Comment, ")" ),
                            vjust=1.5), show_guide=FALSE)
于 2013-05-22T21:22:46.437 回答