r - 从两个向量创建带状疱疹

Question

我想根据两列对数据框的值进行分类。假设，我有以下数据框：

my.df <- data.frame(a=c(1:20), b=c(61:80))

现在我想通过将 2D 散点图分成 4 个相等的部分，然后在中间覆盖一个由 4 个部分的四分之一组成的矩形，将其细分为 8 个区域。到目前为止，我一直在使用以下乏味的方式：

ar <- range(my.df$a)
br <- range(my.df$b)

aint <- seq(ar[1], ar[2], by=(ar[2]-ar[1])/4)
bint <- seq(br[1], br[2], by=(br[2]-br[1])/4)

my.df$z <- NA
my.df[which(my.df$a < aint[3] & my.df$b < bint[3]),"z"] <- 1
my.df[which(my.df$a < aint[3] & my.df$b >= bint[3]),"z"] <- 2
...
my.df[which(my.df$z == 1 & my.df$a >= aint[2] & my.df$b >= bint[2]),"z"] <- 5
...

我确信必须有一种方法可以以更简洁和更通用的方式来完成，即通过编写通用函数，但我自己正在努力编写一个。

另外，我惊讶地发现，在这一切之后，该列的类z自动设置为shingle. 为什么？如何R“知道”这是一个shingle?

score 1 · Accepted Answer

我会先将它分成 16 组（x 和 y 分别分成 4 组），然后将它们重新组合成更少的组。

my.df$a.q <- cut(my.df$a, breaks=4, labels=1:4)
my.df$b.q <- cut(my.df$b, breaks=4, labels=1:4)
my.df$a.b.q <- paste(my.df$a.q, my.df$b.q, sep=".")
my.df$z <- c("1.1"=1, "1.2"=1, "1.3"=2, "1.4"=2, 
             "2.1"=1, "2.2"=3, "2.3"=4, "2.4"=2,
             "3.1"=5, "3.2"=6, "3.3"=7, "3.4"=8,
             "4.1"=5, "4.2"=5, "4.3"=8, "4.4"=8)[my.df$a.b.q]

这似乎是合理的

plot(my.df$a, my.df$b, col=my.df$z)

使用一些覆盖范围更广的数据：

set.seed(1234)
my.df <- data.frame(a=runif(1000, 1, 20), b=runif(1000, 61, 80))

在此处输入图像描述

r - 从两个向量创建带状疱疹

1 回答 1

Related

Reference