1

我在 KhanAcademy.com 上关注有关箱线图的示例。

我尝试使用以下代码模拟 R 中的问题

x <- c(13,9,11,8,8,12,9,9,4,12,10,8,11)
summary(x)
Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
4.000   8.000   9.000   9.538  11.000  13.000 

KA 的 Sal 表示,有两种方法可以获得四分位数,区别在于计算第一个和第三个四分位数时是否有一个因素是中位数。

有没有办法告诉汇总函数在计算其他四分位数时要排除中位数。

如果采用这种方法,答案将是

Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
4.000   8.000   9.000   9.538  *11.500*  13.000 

为什么没有就如何解决此类问题达成一致的方法?

4

1 回答 1

1

R中实际上有 9 种类型quantile可用。有关?quantile如何定义它们、哪些统计软件实现哪些统计软件以及推导它们的参考的更多信息,请参阅。你可以在这里看到它们:

t(sapply(1:9, function(y) quantile(x,type=y)))
      0% 25% 50%      75% 100%
 [1,]  4   8   9 11.00000   13
 [2,]  4   8   9 11.00000   13
 [3,]  4   8   9 11.00000   13
 [4,]  4   8   9 11.00000   13
 [5,]  4   8   9 11.25000   13
 [6,]  4   8   9 11.50000   13
 [7,]  4   8   9 11.00000   13
 [8,]  4   8   9 11.33333   13
 [9,]  4   8   9 11.31250   13

您会注意到,对于您的数据,只有第三个四分位数有变化。R 的默认值是类型 7,这就是您将从summary.

于 2014-09-29T10:51:06.133 回答