0

我有一个数字矩阵,我想从每列中获取 5 个最低(最小值)元素的平均值。我正在尝试使用可用的不同应用功能之一。但我做不到。

这是我需要应用的功能,我已经用 for 循环对其进行了测试,效果很好。

   mean(head(sort(table[,x]),5))

这是我尝试过的几个示例之一:

   a<-mapply(function(x){mean(head(sort(table[,x]),5))},table)

我收到以下错误:

   Error in `[.data.frame`(x, order(x, na.last = na.last, decreasing = decreasing)) :   undefined columns selected 

我也尝试过 sapply,lapply ......但我没有让它工作。找不到任何依据,上网冲浪..

提前致谢

4

4 回答 4

4

你最简单的猜测是在这里应用,因为你想按列应用。使用一些示例数据:

set.seed(123)
df = matrix(rnorm(100), 10, 10)

这将起作用:

apply(df, 2, function(x) mean(sort(x, decreasing = F)[1:5]))

这段代码在做什么?

  • 应用的第一个参数是数据,在这里df(你在你的问题中称之为table)。
  • 第二个参数2表示该函数应用于每一列。也有1行和c(1,2)两者。
  • 第三个参数是你的函数。由于这不是微不足道的,因此最好在原地定义它,即定义 x 的函数(将 x 想象为数据框/矩阵的一列),然后取mean前 5 个元素中的一个(索引[1:5]) 的sort。您还可以看到如何将更多参数传递给函数(例如decreasing = FALSE,这里承认这是默认行为,但假设您想要 5 个最高值的平均值)。如果您缺少数据,您可能希望将na.rm = TRUE其作为参数添加到mean.

这是您的输出:

> apply(df, 2, function(x) mean(sort(x, decreasing = F)[1:5]))
 [1] -0.6376458 -0.5049506 -1.1295099 -0.1233905 -0.7905504 -0.3444174 -0.5745786 -1.0836254 -0.1159064 -0.4503110
于 2015-07-22T10:10:20.447 回答
4

您正在寻找colMeans,使代码更紧凑:

colMeans(head(apply(m, 2, sort),5))
于 2015-07-22T10:24:36.530 回答
2

尝试这个:

set.seed(1)
(mat <- matrix(sample(1:12, 12), ncol = 3))
#      [,1] [,2] [,3]
# [1,]    4    2    3
# [2,]    5    7    1
# [3,]    6   10   11
# [4,]    9   12    8
n <- 2
apply(mat, 2, function(x) mean(head(sort(x), n)))
# [1] 4.5 4.5 2.0
于 2015-07-22T10:07:10.917 回答
1

尝试使用应用:

a<-apply(table,2,function(x){mean(head(sort(x),5))})
于 2015-07-22T10:07:53.763 回答