我希望这不是一个骗局——我已经进行了长时间的艰苦搜索,发现了许多类似的问题,但没有解决我的问题。
我有一个数据框,1 列包含数据,另外 2 列是我之前计算的分位数度量。
set.seed(123)
d <- data.frame(data = 100:199, quantile1 = runif(100), quantile2 = runif(100))
head(d)
data quantile1 quantile2
1 100 0.2875775 0.5999890
2 101 0.7883051 0.3328235
3 102 0.4089769 0.4886130
4 103 0.8830174 0.9544738
5 104 0.9404673 0.4829024
6 105 0.0455565 0.8903502
我想要一种根据 quantile1 和 quantile2 列拆分数据的聪明方法。例如,我想要 quantile1 < 0.25 且 quantile2 > 0.5 的行。我目前正在这样做:
d[d[,2] < 0.25 & d[,3] > 0.5, ]
这很有效,但如果我有很多子集我想将我的数据拆分成很多子集,那就有点麻烦了。我正在考虑在以下边界进行拆分:
quantile1 0.25, 0.75 (three subsets)
然后对于 quantile1 的每个子集,进一步分割边界:
quantile2 0.5 (2 subsets)
所以总共产生6个子集。
谢谢。