1

Random.length如果值落入基于 data.frame 的给定区间,我想分配值(概率)Data$Measure

样本数据:

set.seed(123)
Data <- data.frame(Measure=sort(rnorm(10,5,2),decreasing=FALSE),
        Probability=sort(runif(10,0,1),decreasing=FALSE))
Random.length <- as.vector(sort(rnorm(5,5,2),decreasing=FALSE))

在这里,我希望能够将概率分配给与 data.frameRandom.length中的值相对应的向量。MeasureData

这是我尝试过的。它有点工作。(只是为了表明我的意思......)

AssignValue <- function (x,y,z){
CopyNumber <- rep(0, length(x))
for(i in 1:length(x)){
    if(x[i] <= y[1]) { CopyNumber[i] <- z[1]
} else if(x[i] > y[1] & x[i] < y[2]) {  CopyNumber[i] <- z[2]
} else if(x[i] > y[2] & x[i] < y[3]) {  CopyNumber[i] <- z[3]
} else if(x[i] > y[3] & x[i] < y[4]) {  CopyNumber[i] <- z[4]
} else if(x[i] > y[4] & x[i] < y[5]) {  CopyNumber[i] <- z[5]
} else if(x[i] > y[5] & x[i] < y[6]) {  CopyNumber[i] <- z[6]
} else if(x[i] > y[6] & x[i] < y[7]) {  CopyNumber[i] <- z[7]
} else if(x[i] > y[7] & x[i] < y[8]) {  CopyNumber[i] <- z[8]
} else if(x[i] > y[8] & x[i] < y[9]) {  CopyNumber[i] <- z[9]
} else if(x[i] > y[9]) {  CopyNumber[i] <- z[10]
}
}
CopyNumber
}


AssignValue(Random.length,Data$Measure,Data$Prob)

现在我的 data.frameData的长度为 51,所以我的实际循环最多 ...z[51] 基本上扫描整个 data.frame。我只是为了演示而缩短了这个。所以实际的解决方案应该能够应对可能的任意长度。

此外,该解决方案应该能够使用任意长度的Random.length向量。

编辑:循环结束时的小错误,现已更正。

4

1 回答 1

4

如果没有发布您想要的输出,很难确定,但这应该有效:

> Data$Prob[cut(Random.length, c(0, Data$Measure[1:9], Inf))]

[1] 0.1471136 0.5941420 0.8895393 0.8895393 0.9942698

要以编程方式调整索引Data$Measure,您需要ind = 1:(nrow(Data)-1). 我更愿意将其作为一个单独的步骤来避免混乱,但这只是我。

from comments c(0, head(Data$Measure, -1), Inf)是一个更简单的选择

于 2013-10-03T16:18:23.437 回答