7

我正在使用一个数据集,其中 csv 文件的第 11 列包含数字数据。它也包含一些 NA 值。这是对象的str:

str(dataheart)
 num [1:4706] 14.3 18.5 18.1 NA NA NA 17.7 18 15.9 NA ...

因此,作为 R 的新学生,我曾期望结果range(dataheart)是最小值和最大值。通过查看带有数据的 CSV 文件,我知道最小值和最大值分别为 10.1 和 21.9。

但上面返回一个向量

[1] NA NA

我对这个功能的理解不正确吗?

4

1 回答 1

53

你需要

range(x,na.rm=TRUE)

?range

base为了获得额外的荣誉,这里是使用和stats包中的函数列表na.rm

uses_na_rm <- function(x) is.function(fx <- get(x)) && 
                         "na.rm" %in% names(formals(fx))
basevals <- ls(pos="package:base")
basevals[sapply(basevals,uses_na_rm)]
##  [1] "colMeans"                "colSums"                
##  [3] "is.unsorted"             "mean.default"           
##  [5] "pmax"                    "pmax.int"               
##  [7] "pmin"                    "pmin.int"               
##  [9] "range.default"           "rowMeans"               
## [11] "rowsum.data.frame"       "rowsum.default"         
## [13] "rowSums"                 "Summary.data.frame"     
## [15] "Summary.Date"            "Summary.difftime"       
## [17] "Summary.factor"          "Summary.numeric_version"
## [19] "Summary.ordered"         "Summary.POSIXct"        
## [21] "Summary.POSIXlt"        

statvals <- ls(pos="package:stats")
statvals[sapply(statvals,uses_na_rm)]
## [1] "density.default"  "fivenum"          "heatmap"          "IQR"             
## [5] "mad"              "median"           "median.default"   "medpolish"       
## [9] "quantile.default" "sd"               "var"   

为了进一步考虑 R 中的哪些函数处理NAs 以及如何处理,可以对带有na.action参数(lm和朋友)的函数进行类似的搜索。

于 2013-01-20T15:27:26.260 回答