我想为我的变量计算面板描述性统计数据,类似于 Stata 如何使用“xtsum”函数提供它们。我几乎可以计算所有内容(整体/在 sd 内、平均值、最小值、最大值),但我似乎无法使用公式找到可靠的来源来计算 sd 之间的值。任何知道公式/有可靠来源的人?
到目前为止,我已经使用了来自这个线程的公式之间/在 R 的标准偏差之间。但我不确定这个公式是否正确。
我想为我的变量计算面板描述性统计数据,类似于 Stata 如何使用“xtsum”函数提供它们。我几乎可以计算所有内容(整体/在 sd 内、平均值、最小值、最大值),但我似乎无法使用公式找到可靠的来源来计算 sd 之间的值。任何知道公式/有可靠来源的人?
到目前为止,我已经使用了来自这个线程的公式之间/在 R 的标准偏差之间。但我不确定这个公式是否正确。
在这篇文章中:R 的 xtsum 命令?您会找到整个xtsum
命令的 R 实现。您可以选择变体之间的线。它隐藏了一点。
我使用了一些简单的示例数据,它完美地复制了来自 Stata 的结果:
paneldata = data.frame(id=c(1,1,1,2,2,2,3,3,3), time=seq(1:3), variable=c(9,10,11,20,20,20,25,30,35))
XTSUM(paneldata, varname = variable, unit=id)
带有“XTSUM”的 R 输出:
状态输出:
请注意在 Stata 中调整的内公式中的一些差异。您还可以在这篇文章中找到有价值的信息:
http://stephenporter.org/files/xtsum_handout.pdf
示例数据来自这里:
http://rizaudinsahlan.blogspot.com/2016/06/within-and-between-variation-in-panel.html