4

我正在编写一个函数,它使用 kmeans 来确定 bin 宽度以将连续测量(预测概率)转换为整数(3 个 bin 之一)。我偶然发现了一个边缘情况,在这种情况下,我的算法有可能(正确地)预测整个集合的相同概率,我想处理这种情况。我通过以下方式使用rattle包的功能:binning()

btsKmeansBin <- function(x, k = 3, default = c(0, 0.3, 0.5, 1)) {
  result <- binning(x, bins = k, method = "kmeans", ordered = T)
  bins <- attr(result, "breaks")
  attr(bins, "names") <- NULL
  bins <- bins[order(bins)]
  bins[1] <- 0
  bins[length(bins)] <- 1
  return(bins)
}

在 上运行这个函数x <- c(.5,.5,.5,.5,.5,.5),你会在这order(bins)一步得到一个错误,因为bins它将是 NULL,因此不是向量。

显然,如果x只有一个不同的值,kmeans 不应该工作。在这种情况下,我想返回defaultbin 分区。发生这种情况时,会binning发出“警告:不考虑变量”。所以我想用它tryCatch来处理这个警告,但是用下面的代码包围这一result <- ...行并不能像我期望的那样工作:

...
tryCatch({
  result <- binning(x, bins = k, method = "kmeans", ordered = T)
}, warning = function(w) {
  warn(sprintf("%s. Using default values", w))
  return(default)
}, error = function(e) {
  stop(e)
})
...

警告被打印出来,好像我没有使用过一样tryCatch,代码继续执行return语句并再次抛出错误order。我尝试了很多变体都无济于事。我在这里错过了什么?

4

1 回答 1

8

如果您查看,binning我想您会发现您看到的“警告”不是通过生成的,warning()而是通过生成的cat(),这就是为什么tryCatch不选择它的原因。对于这种疏忽,作者binning可能应该用湿面条来鞭打几下。;)(或者由于拨浪鼓的特殊工作方式,它可能是故意的,我不确定。)

发生这种情况时它似乎会返回NULL,因此您可以简单地手动处理它。不理想,但可能是唯一的方法。

于 2012-11-16T18:35:18.477 回答