6

在 Windows XP 上使用 R-2.15.2 我得到的最大值与summary()来自max(). 为什么呢?

以下是相关代码:

> class(dat)
[1] "data.frame"
> dim(dat)
[1] 3850   54
> summary(dat$enrol)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
    26     945    1744    3044    3128  183200 
> max(dat$enrol)
[1] 183151

任何想法为什么要summary()对结果进行四舍五入?

最好的奥利弗

4

1 回答 1

15

这是根据参数打印结果的方式digits。默认是

> max(3, getOption("digits")-3)
[1] 4

为什么 R 向上舍入只是使用的默认规则 - 转到最接近的偶数。我们可以通过以下方式看到这一点signif()

> signif(183151, digits = 4)
[1] 183200

正如?summary告诉我们的那样,它是由参数使用并由参数summary()控制的digits

digits: integer, used for number formatting with ‘signif()’ (for
        ‘summary.default’) or ‘format()’ (for ‘summary.data.frame’).

阅读?signif有关舍入问题的更多信息。

要获得更多有效数字,请summary()通过digits参数传递更高的数字。

例如

> set.seed(1)
> vec <- c(10, 100, 1e4, 1e5, 1e6) + runif(5)
> summary(vec)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
     10.3     100.4   10000.0  222000.0  100000.0 1000000.0 
> summary(vec, digits = 7)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
     10.3     100.4   10000.6  222022.5  100000.9 1000000.0 
> summary(vec, digits = 8)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
     10.3     100.4   10000.6  222022.5  100000.9 1000000.2 
于 2013-01-26T12:17:23.743 回答