我很惊讶地发现clara
fromlibrary(cluster)
允许 NA。但是函数文档没有说明它如何处理这些值。
所以我的问题是:
- 如何
clara
处理 NA? - 这可以以某种方式用于
kmeans
(不允许Nas)吗?
[更新]所以我确实在clara
函数中找到了代码行:
inax <- is.na(x)
valmisdat <- 1.1 * max(abs(range(x, na.rm = TRUE)))
x[inax] <- valmisdat
将缺失值替换为valmisdat
. 不确定我是否理解使用这种公式的原因。有任何想法吗?将每列分别处理 NA 是否更“自然”,也许用平均值/中位数代替?