3

我想知道如何在 R 中创建自己的函数时处理 NA 值。

我的代码如下:

# The function is simple:

function.BHR <-function(x) prod(1+x)-1

# The structure of the data.frame:    
dat <- t(data.frame(
  "A"=c(20:29/100),
  "B"=c(35:44/100),
  "C"=c(20:29/100),
  "E"=c(50:57/100,NA,NA),
  "E"=c(45:51/100,NA,NA,NA))

apply(dat,2,function.BHR)

简单的 apply 函数为最后三列提供 NA。取而代之的是,
它应该应用所有非 NA 值的功能。因此:

  for column 8: 
  function.BHR(c(0.27,0.42,0.27,0.57))
[1] 2.595799

for column 9: 
  function.BHR(c(0.28,0.43,0.28))
[1] 1.342912

for column 10: 
  function.BHR(c(0.29,0.44,0.29))
[1] 1.396304

提前致谢!

乔治

4

3 回答 3

7

您可以简单地na.rm使用prod. 详情见?prod

function.BHR <-function(x) { prod(1+x, na.rm=TRUE)-1 }

apply(dat, 2, function.BHR)

# [1] 3.228200 3.389747 3.556183 3.727619 3.904166 4.085938 4.273048 2.595799 1.342912 1.396304
于 2013-06-23T18:55:14.527 回答
5

更改您的功能以删除NA

function.BHR <-function(x) {
   x = x[!is.na(x)]
   (prod((1+x))-1)
}

> apply(dat,2,function.BHR)
 [1] 3.228200 3.389747 3.556183 3.727619 3.904166 4.085938 4.273048 2.595799
 [9] 1.342912 1.396304

is.na返回一个逻辑向量,告诉哪些值是NA!(NOT) 运算符反转这个逻辑向量,即TRUE对于一个有效值,FALSE对于NA。使用此向量进行索引只会返回有效值。

于 2013-06-23T18:53:26.967 回答
3

你可以使用logarithmsthat'll turn the productto sumswhich you can use colSumswhich is vectorized and is much faster than looping with apply:

exp(colSums(log(dat+1), na.rm=TRUE))-1
# [1] 3.228200 3.389747 3.556183 3.727619 3.904166 4.085938 4.273048 2.595799 1.342912 1.396304
于 2013-06-23T22:15:22.953 回答