0

我有一个数据集,其中包含一些异常值,我在 ggplot 中将它们绘制为栅格。未修改的配色方案往往会以显示大多数数据的分布为代价来突出这些异常值。设置限制会有所帮助,但超出指定限制的值会丢失。有没有办法在颜色渐变的末尾绘制超出限制的值?

这是来自忠实数据集的示例。这不是我的数据的完美类比,因为没有异常值导致问题,但它显示了我的问题。

ggplot(faithfuld, aes(waiting, eruptions)) +
  geom_raster(aes(fill = density))+
  scale_fill_gradientn(colours = 
  c("red", "orange", "yellow", "green","blue","purple","white"))

假设我想少关注更高的值。也许有更好的方法来做到这一点而不是设置限制?有了限制,我将数据放宽到最大值(此处为 0.03)之上。

ggplot(faithfuld, aes(waiting, eruptions)) +
geom_raster(aes(fill = density))+
scale_fill_gradientn(limits = c(0,.03),
                   colours = c("red","orange", "yellow", "green","blue",
                               "purple","white"))

理想情况下,我想像在 GIS 中那样绘制它,其中超出我限制的值将设置为色带的最大值。我总是可以破解数据来显示这个,但我希望 ggplot 中有一个更优雅的解决方案。

4

1 回答 1

1

您可以使用na.value定义异常值的颜色,并将异常值颜色与最大值的颜色匹配。

ggplot(faithfuld, aes(waiting, eruptions)) +
  geom_raster(aes(fill = density))+
  scale_fill_gradientn(limits = c(0,.03),
                       na.value = "white", #na.value color same as color for max value
                       colours = c("red","orange", "yellow", "green","blue",
                                   "purple","white"))

这样做的一个缺点是,白色的刻度仍然显示 0.03,尽管它应该读取 >0.03 才能准确。您可能需要编辑比例以使标签准确。

于 2019-06-13T18:33:11.617 回答