我正在使用cut
将我的数据划分为 bin,这将生成的 bin 类似于(x1,x2]
. 谁能告诉我如何制作一个新列,将这些垃圾箱表示为垃圾箱的中点?例如,使用以下数据框:
structure(list(x = c(1L, 4L, 6L, 7L, 8L, 9L, 12L, 18L, 19L),
y = 1:9), .Names = c("x", "y"), class = "data.frame", row.names = c(NA,
-9L))
我可以用
test$xRange <- cut(test$x, breaks=seq(0, 20, 5))
给予
x y xRange
1 1 1 (0,5]
2 4 2 (0,5]
3 6 3 (5,10]
4 7 4 (5,10]
5 8 5 (5,10]
6 9 6 (5,10]
7 12 7 (10,15]
8 18 8 (15,20]
9 19 9 (15,20]
但我需要的结果应该如下所示:
x y xRange xMidpoint
1 1 1 (0,5] 2.5
2 4 2 (0,5] 2.5
3 6 3 (5,10] 7.5
4 7 4 (5,10] 7.5
5 8 5 (5,10] 7.5
6 9 6 (5,10] 7.5
7 12 7 (10,15] 12.5
8 18 8 (15,20] 17.5
9 19 9 (15,20] 17.5
我进行了一些搜索,并在将一系列值划分为等长的箱中时遇到了类似的问题: cut vs cut2,它给出了一个解决方案
cut2 <- function(x, breaks) {
r <- range(x)
b <- seq(r[1], r[2], length=2*breaks+1)
brk <- b[0:breaks*2+1]
mid <- b[1:breaks*2]
brk[1] <- brk[1]-0.01
k <- cut(x, breaks=brk, labels=FALSE)
mid[k]
}
但是当我在我的情况下尝试这个时,使用
test$xMidpoint <- cut2(test$x, 5)
它没有返回正确的中点。也许我错误地输入了休息时间cut2
?谁能告诉我我做错了什么?