我有面板数据时间序列,我想用给定变量的平均值的四分位数创建一个变量,以便只能在给定的四分位数中找到公司。例如,如果我有 4 家公司:
df =
id year value Quartile* Quartile**
1 2010 1 1 1
1 2015 1 1 1
2 2010 10 2 2
2 2015 10 2 2
3 2010 10 2 3
3 2015 20 3 3
4 2010 40 4 4
4 2015 40 4 4
使用标准方法四分位数*,例如:
df<- within(df, Quartile* <- as.integer(cut(TotalAssets_wins,
quantile(value, probs=0:4/4),
include.lowest=TRUE)))
我获得了四分位数*的值,但是,我想防止公司随着时间的推移具有不同的四分位数值。出于这个原因,我想在给定每个公司所有观察值的平均值的情况下计算四分位数的值,以获得四分位数**的值。关键区别在于它们是企业依赖值。关于如何在我的代码中实现这一点的任何想法?