6

我们正在尝试使用 ggplot2 绘制面积图,其中 x 轴上方的正区域是一种颜色,而负区域是另一种颜色。

给定这个数据集,我想要一个面积图,在轴的每一侧用不同的颜色着色。

我可以看到一种将数据集划分为两个子集的方法,一个是所有负值为零的正数,一个是所有正值为零的负数,然后将它们分别绘制在同一轴上,但似乎会有一个更像ggplot的方式来做到这一点。

在这个问题上发布的解决方案没有给出准确的结果(见下文)。

示例数据准确显示为条形图

原始数据

由此代码生成:

# create some fake data with zero-crossings
yvals=c(2,2,-1,2,2,2,0,-1,-2,2,-2)
test = data.frame(x=seq(1,length(yvals)),y=yvals)

# generate the bar plot
ggplot(data=test,aes(x=x,y=y)) 
    + geom_bar(data=test[test$y>0,],aes(y=y), fill="blue",stat="identity", width=.5) 
    + geom_bar(data=test[test$y<0,],aes(y=y), fill="red",stat="identity", width=.5)

RLE 方法不通用

在另一个问题上提出的 RLE 方法在应用于我们的数据集时会产生与过零相关的伪影:

功能区 RLE 图

由以下代码生成(请勿使用):

# set up grouping function
rle.grp <- function(x) {
   xx <- rle(x)
   xx$values = seq_along(xx$values)
   inverse.rle(xx) }

# generate ribbon plot
ggplot(test, aes(x=x,y=y,group = factor(rle.grp(sign(y))))) + 
    geom_ribbon(aes(ymax = pmax(0,y),ymin = pmin(0,y),
   fill = factor(sign(y), levels = c(-1,0,1), labels = c('-','0','+')))) 
   + scale_fill_brewer(name = 'sign', palette = 'RdBu')

按照@baptiste 和 Kohske 的建议,请参阅下面的最终答案。

4

3 回答 3

13

根据@baptiste 的评论(已删除),我会说这是最好的答案。它基于Kohske 的这篇文章。它在零交叉处向数据集添加新的 xy 对,并生成下图:

# create some fake data with zero-crossings
yvals = c(2,2,-1,2,2,2,0,-1,-2,2,-2)
d = data.frame(x=seq(1,length(yvals)),y=yvals)

rx <- do.call("rbind",
   sapply(1:(nrow(d)-1), function(i){
   f <- lm(x~y, d[i:(i+1),])
   if (f$qr$rank < 2) return(NULL)
   r <- predict(f, newdata=data.frame(y=0))
   if(d[i,]$x < r & r < d[i+1,]$x)
      return(data.frame(x=r,y=0))
    else return(NULL)
 }))
 d2 <- rbind(d,rx)
 ggplot(d2,aes(x,y)) + geom_area(data=subset(d2, y<=0), fill="pink") 
     + geom_area(data=subset(d2, y>=0), fill="lightblue") + geom_point()

生成以下输出: 示例图

于 2013-08-02T05:09:07.877 回答
1

我使用以下易于理解的逻辑做了一个非常相似的情节。我为正值和负值创建了以下两个对象。请注意,那里有一个“非常小的数字”,以避免从一个点到另一个点的跳跃而不通过零。

pos <- mutate(df, y = ifelse(ROI >= 0, y, 0.0001))
neg <- mutate(df, y = ifelse(ROI < 0, y, -0.0001))

然后,只需将geom_areas 添加到您的ggplot对象中:

ggplot(..., aes(y = y)) + 
  geom_area(data = pos, fill = "#3DA4AB") +
  geom_area(data = neg, fill = "tomato")

希望对你有帮助!;)

于 2019-07-19T22:25:06.997 回答
1

我想对此添加更新,首先是提供一种更简单的方法dplyr,其次是使@beroe 的答案更具可读性。

一个新的答案

您可以用代数方式求解 x。该方程来自重新排列直线方程 (y = mx + b) 以求解给定另外两个点和 y = 0 的 x。

library(dplyr)
library(magrittr)
library(ggplot2)

df <- data.frame(x = 1:10, y = runif(10, -1, 1))

df_inbetween <- df %>% 
  mutate(
    # Solve for x given two points and y = 0
    xzero = -((y * (lead(x) - x)) / (lead(y) - y)) + x,
    xzero_valid = xzero > x & xzero < lead(x),
    xzero = replace(xzero, !xzero_valid, NA),
    yzero = 0,
    yzero = replace(yzero, !xzero_valid, NA)
  ) %>% 
  select(x = xzero, y = yzero) %>% 
  filter(!is.na(x))

df <- rbind(df, df_inbetween)

ggplot(data = df, aes(x = x, y = y)) + 
  geom_area(data = filter(df, y >= 0), fill = 'pink') +
  geom_area(data = filter(df, y <= 0), fill = 'light blue') +
  geom_point()

重写beroe的答案

这不太简洁,但原始答案很难阅读。此外,最好使用lapply,因为sapply不会简化此处的列表。

library(ggplot2)
d <- data.frame(x = 1:10, y = runif(10, -1, 1))

find_root <- function(i){
  f <- lm(x~y, d[c(i, i+1),])
  
  # If the model is invalid, NULL
  if (f$qr$rank < 2) return(NULL)
  
  r <- predict(f, newdata=data.frame(y=0))
  
  # Check if that point falls between the two other x-values
  if(d[i,]$x < r & r < d[i+1,]$x)
    return(data.frame(x=r,y=0))
  
  else return(NULL)
}

# Make dataset containing root points
rx <- do.call('rbind', 
  lapply(1:(nrow(d) - 1), find_root)
)

# Append and plot
d2 <- rbind(d,rx)

ggplot(d2,aes(x, y)) + 
  geom_area(data=subset(d2, y<=0), fill="pink") + 
  geom_area(data=subset(d2, y>=0), fill="lightblue") + 
  geom_point()

注意:对于这两种解决方案,如果您的数据集除了 x 和 y 之外还有其他变量,则最终的 rbind 调用将失败。在解决方案中,您可以根据需要dplyr更改呼叫。select

于 2020-12-24T03:56:32.610 回答