16

有人可以解释一下这一行 R 代码是如何工作的吗?

split(dat, f) <- lapply(split(dat, f), max)

我以为这只是一个回收规则,但我真的无法理解。

数据示例:

dat <- c(1, 2, 3, 100, 200, 300)
f <- as.factor(c("a", "a", "b", "a", "b", "b"))
split(dat, f) <- lapply(split(dat, f), max)
dat
[1] 100 100 300 100 300 300

代码做我想做的事(按组分配最大值),但问题是这是如何完成的?

4

2 回答 2

9

拆分给出了值dat[c(1,2,4)]dat[c(3,5,6)]来自向量。

分配等同于dat[c(1,2,4)] <- 100 ; dat[c(3,5,6)] <- 300,这就是回收发生的地方。

已编辑

至于会发生什么,以及为什么会产生向量分配,请参阅语言定义手册 (http://cran.r-project.org/doc/manuals/R-lang.pdf) 的第 21 页。来电:

split(def, f) <- Z

被解释为:

‘*tmp*‘ <- def
def <- "split<-"(‘*tmp*‘, f, value=Z)
rm(‘*tmp*‘)

请注意,split<-.default返回修改后的向量。

于 2013-01-12T14:15:20.987 回答
5

感谢评论,答案在split<-.default

只是为了解释它的行为,在这里我 split<-.default在问题中调用了我的调用结果

`split<-.default` <- function(dat, f,value = lapply(split(dat, f), max))
{
    ix <- split(seq_along(dat), f, drop = drop, ...)  ## the call of split here!!
    n <- length(value)
    j <- 0
    for (i in ix) {
        j <- j %% n + 1
        x[i] <- value[[j]]  ## here we assign the result of the first split
    }
    x
}
于 2013-01-12T14:16:03.453 回答