新的 R 用户。我正在尝试根据这个问题中的过程使用 cut 来拆分基于十分位数的数据集。我想将十分位值添加为数据框中的新列,但是当我这样做时,由于某种原因,最低值被列为 NA。无论 include.lowest=TRUE 还是 FALSE,都会发生这种情况。有人知道为什么吗?
当我使用这个样本集时也会发生,所以它不是我的数据独有的。
数据 <- c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20)
> decile <- cut(data, quantile(data, (0:10)/10, labels=TRUE, include.lowest=FALSE))
> df <- cbind(data, decile)
> df
data decile
[1,] 1 NA
[2,] 2 1
[3,] 3 2
[4,] 4 2
[5,] 5 3
[6,] 6 3
[7,] 7 4
[8,] 8 4
[9,] 9 5
[10,] 10 5
[11,] 11 6
[12,] 12 6
[13,] 13 7
[14,] 14 7
[15,] 15 8
[16,] 16 8
[17,] 17 9
[18,] 18 9
[19,] 19 10
[20,] 20 10