5

这是我的可重现数据:

library("ggplot2")
library("ggplot2movies")
library("quantreg")    
set.seed(2154)
msamp <- movies[sample(nrow(movies), 1000), ]

我正在尝试熟悉stat_quantile但文档中的示例提出了几个问题。

mggp <- ggplot(data=msamp, mapping=aes(x=year, y=rating)) + 
    geom_point() + 
    stat_quantile(formula=y~x, quantiles=c(0, 0.25, 0.50, 0.75, 1)) + 
    theme_classic(base_size = 12) + 
    ylim(c(0,10))
mggp
  1. 据我了解,分位数将数据拆分为小于定义的截止值的部分,对吗?如果我在下面的代码中定义分位数,我会得到五行。为什么?它们代表什么?

  2. 似乎分位数是根据 y 轴上的因变量(评级)计算的。有可能扭转这种局面吗?我的意思是根据“年”中的分位数分割数据?

4

1 回答 1

3

该函数执行分位数回归,每条线是

来自维基百科

分位数回归是统计和计量经济学中使用的一种回归分析。鉴于在给定预测变量的某些值的情况下,最小二乘法产生的估计值近似于响应变量的条件均值,而分位数回归旨在估计响应变量的条件中位数或其他分位数。

因此,回归图中的每条线都是分位数的估计值,例如中位数、第 75 和第 100 个百分位数。

您可以在quantreg包的小插图中找到详细的技术讨论。

在此处输入图像描述

于 2016-05-11T11:06:02.953 回答