5

我有一个包含 100 个观察值的双变量数据集。我使用了六边形分箱,最终得到了 26 个六边形分箱。为了保存 26 个六边形 bin 中的每一个中的 100 个观测值的行,我使用了base::attrR 中的函数。在下面的代码中,这是在以下位置完成的:

attr(hexdf, "cID") <- h@cID

我正在尝试创建Plotly六边形分箱的交互式 R 对象,以便如果用户单击给定的六边形箱,他们将获得分组到该箱中的 100 个观察值的行。我已经完成了这个目标的一部分。我的 MWE 如下:

library(plotly)
library(data.table)
library(GGally)
library(hexbin)
library(htmlwidgets)

set.seed(1)
bindata <- data.frame(ID = paste0("ID",1:100), A=rnorm(100), B=rnorm(100))
bindata$ID <- as.character(bindata$ID)

x = bindata[,c("A")]
y = bindata[,c("B")]
h <- hexbin(x=x, y=y, xbins=5, shape=1, IDs=TRUE)
hexdf <- data.frame (hcell2xy (h),  hexID = h@cell, counts = h@count)
attr(hexdf, "cID") <- h@cID
pS <- ggplot(hexdf, aes(x=x, y=y, fill = counts, hexID=hexID)) + geom_hex(stat="identity")

ggPS <- ggplotly(pS)

myLength <- length(ggPS[["x"]][["data"]])
for (i in 1:myLength){
  item =ggPS[["x"]][["data"]][[i]]$text[1]
  if (!is.null(item))
    if (!startsWith(item, "co")){
      ggPS[["x"]][["data"]][[i]]$hoverinfo <- "none"
    }
}

ggPS %>% onRender("
          function(el, x, data) {
            //console.log(el)
            //console.log(x)
            //console.log(data)

            myGraph = document.getElementById(el.id);
            el.on('plotly_click', function(e) {

            cN = e.points[0].curveNumber
            split1 = (x.data[cN].text).split(' ')
            hexID = (x.data[cN].text).split(' ')[2]
            counts = split1[1].split('<')[0]
            console.log(hexID)
            console.log(counts)

           })}
           ", data = pS$data)

当我运行此代码并在 Web 浏览器中打开它时,我获得了一个如下所示的交互式绘图(绿色框不在绘图中;它被叠加用于解释目的):

在此处输入图像描述

如果我点击绿色框内的六边形,正确hexID的 40 和counts3 将打印到控制台。此时,我想获取放入那个六边形 bin 的 3 行原始数据框。

我知道如何在 R 中通过使用该函数onRender()htmlwidgets包的函数之外执行此操作base::attr。例如,我可以执行以下操作:

hexID=40
obsns <- which(attr(pS$data, "cID")==hexID)
dat <- bindata[obsns,]

并收到以下正确的 3 个数据点,这些数据点被放入我点击的那个 bin 中:

     ID         A        B
47 ID47 0.3645820 2.087167
66 ID66 0.1887923 2.206102
71 ID71 0.4755095 2.307978

我正在处理比这个 MWE 更大的数据集。出于这个原因,我使用该base:attr函数的目的是防止更大的数据帧四处飘荡。但是,我不确定如何转换函数的base::attr功能,以便我可以访问onRender()JavaScript 代码中单击的六边形 bin 中出现的适当数据点行。我确实将该pS$data对象包含在onRender()JavaScript 代码中,但仍然卡住了。

任何建议将不胜感激!

4

1 回答 1

1

您可以添加一列,该列的每一行都有它在您的 bindata 中所属的 hexbin 的 ID:

bindata$hex <- h@cID

然后,您可以将其传递给onRender函数并在用户单击六边形时过滤行:

ggPS %>% onRender("
                  function(el, x, data) {
                  myGraph = document.getElementById(el.id);
                  el.on('plotly_click', function(e) {

                  cN = e.points[0].curveNumber
                  split1 = (x.data[cN].text).split(' ')
                  hexID = (x.data[cN].text).split(' ')[2]
                  counts = split1[1].split('<')[0]

                  var selected_rows = [];

                  data.forEach(function(row){
                    if(row.hex==hexID) selected_rows.push(row);
                  });
                  console.log(selected_rows);

                  })}
                  ", data = bindata)
于 2017-02-25T05:30:03.013 回答