我正在编写一个函数,它使用 kmeans 来确定 bin 宽度以将连续测量(预测概率)转换为整数(3 个 bin 之一)。我偶然发现了一个边缘情况,在这种情况下,我的算法有可能(正确地)预测整个集合的相同概率,我想处理这种情况。我通过以下方式使用rattle
包的功能:binning()
btsKmeansBin <- function(x, k = 3, default = c(0, 0.3, 0.5, 1)) {
result <- binning(x, bins = k, method = "kmeans", ordered = T)
bins <- attr(result, "breaks")
attr(bins, "names") <- NULL
bins <- bins[order(bins)]
bins[1] <- 0
bins[length(bins)] <- 1
return(bins)
}
在 上运行这个函数x <- c(.5,.5,.5,.5,.5,.5)
,你会在这order(bins)
一步得到一个错误,因为bins
它将是 NULL,因此不是向量。
显然,如果x
只有一个不同的值,kmeans 不应该工作。在这种情况下,我想返回default
bin 分区。发生这种情况时,会binning
发出“警告:不考虑变量”。所以我想用它tryCatch
来处理这个警告,但是用下面的代码包围这一result <- ...
行并不能像我期望的那样工作:
...
tryCatch({
result <- binning(x, bins = k, method = "kmeans", ordered = T)
}, warning = function(w) {
warn(sprintf("%s. Using default values", w))
return(default)
}, error = function(e) {
stop(e)
})
...
警告被打印出来,好像我没有使用过一样tryCatch
,代码继续执行return
语句并再次抛出错误order
。我尝试了很多变体都无济于事。我在这里错过了什么?