0

ggplot用来显示一系列带有stat_summary_hex图层的底图,以显示人口的净变化。要重新调整我的价值观,scale_fill_gradientn我需要知道minmax ..value..stat_summary_hex.

这是一个简化的示例:

Hex_Summary <- stat_summary_hex(aes(x = Lon, y = Lat, z = Churn),
   bins=100, colour = NA, geom = "hex", fun = function(x) sum(x))

我尝试了以下方法来获取函数产生的最小值和最大值fun

PlotEnv <- ggplot() + HexSummary
PlotData <-ggplot_build(PlotEnv)  

BinnedValues <- PlotData[["data"]][[1]]$value
BinMin <- min(BinnedValues) 
BinMax <- max(BinnedValues)

但是,ggplot_build我能够访问的数据 ( PlotData[["data"]][[1]]$value) 与实际图中的值不匹配。

Per Henrik 的评论:当我在情节中添加 geom_text 时,

hexlab <- stat_summary_hex(geom="text",
  aes(x = Lon, y = Lat, z = Churn, label=..value..), size = 1, color="black",
  fun = function(x) (sum(x)))

我可以看到分箱六边形的最大值是 79;但是,当我这样做时

PlotData[["data"]][[1]]$value

我认为这是情节背后的数据,我看到最大值仅为 29。此外,其中的行数PlotData[["data"]][[1]]不等于绘制的六边形的数量。看起来使用 ggplot_build 不是查看 binned 函数结果的合法方式。

一般来说,有没有更好的方法来访问包含函数中所有坐标和值的数据框stat_summary_hexstat_summary_hex或者,是否有适当的方法来简单地确定语句中函数产生的最小值和最大值 ?

编辑:在回过头来记录到底有什么不同后,我找到了原因:我的实际功能比给出的第一个示例更复杂:

stat_summary_hex(aes(x = Lon, y = Lat, z = Churn),
  bins=100, colour = NA, geom = "hex", drop = TRUE,
  fun = function(x) if(abs(sum(x)) > 5) {sum(x)} else {NA})

为什么这会影响其他十六进制位置的总和并没有理由。例如,在总和应该为 79 的给定单元格中,最大值ggplot_build为 29,但是当更改函数和 set 时drop = F,我看到预期值为 79。

4

0 回答 0