问题标签 [panel-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql - MS Access 交叉表查询中的四分位数计算
我有一个包含超过 1000 万行数据的贸易统计数据集,因此无法使用 Excel。我是访问的初学者。
我创建了一个交叉表查询(见下文):
所以我的输出在第一列(垂直)中有产品和期间,顶部水平行是国家(合作伙伴)。每个国家(合作伙伴)和产品都有自己独特的价值。
我需要计算每个产品行的第一个和第三个四分位数。理想情况下,我希望有两个新列:Quartile1 和 Quartile3,它们计算所有给定合作伙伴的每个产品的四分位数。
我希望输出看起来像这样:
产品、时期、国家 1、国家 2、四分位数 1、四分位数 2
1、日期、值、值、quartilevalue1、quartilevalue2
2、日期、值、值、quartilevalue1、quartilevalue2
3、日期、数值、数值、quartilevalue1、quartilevalue2
4、日期、值、值、quartilevalue1、quartilevalue2
5、日期、数值、数值、quartilevalue1、quartilevalue2
这在 Access 中可能吗?我一直在无休止地寻找解决方案,但被卡住了。
非常感谢您的帮助!
干杯,亚历克斯
r - 在R中计算处理后的差异
我对 R 中的面板数据有疑问。
我的数据基本上是这样的:
是否有机会计算 R 中治疗前后(关于一定时滞)因变量的差异?
不幸的是,我只有不平衡的面板数据。计算的目的是从中得出一个虚拟变量。这将显示两年后因变量是否增长。然后,我想对其进行 clogit 回归。
编辑
我需要知道治疗后因变量是否发生了变化。所以我需要某种代码来为我的变量的每一个积极变化计算一个虚拟变量。
输出应该是这样的:
因此,我可以对其进行条件 logit 回归,并将治疗(包括其他变量)与在一定时间滞后后对我的因变量的积极影响联系起来。
graph - Alter Stata 绘图方案
从面板数据集中,我正在按国家/地区绘制大量国家/地区的时间序列。
对于每个国家,图形代码如下:
twoway (tsline spread if Cntry == 1) (tsline bidask if Cntry == 1, yaxis(3)) (tsline debt if Cntry == 1, yaxis(2) name(country1) title(Austria))
我需要更改图表的几个特征,例如
- 将标题字体更改为中大
- 将 X 和我的 3 Y 轴的图例字体更改为小
- 更改我的 X 轴上的刻度数
- 更改 X 轴图例的角度
有没有办法直接修改官方的Stata方案,而不是更改我每个ID的代码?
r - 使用相关数据进行插补 (R)
我有一个包含人口数据的面板数据集。我主要使用两个向量 - 人口和家庭。家庭向量(有 3 个国家)有大量缺失值,人口向量是满的。我使用以人口为自变量的模型来获取家庭的缺失值。我应该使用什么函数来提取这些值?我不需要做任何预测,只是为了填补缺失的数据。谢谢你。
编辑:这是我的数据集的打印屏幕: https ://imagizer.imageshack.us/v2/1366x440q90/661/RAH3uh.jpg 如您所见,缺少许多 datatype = "original" 数据的值,我需要输入它以某种方式。我已经创建了几个面板数据模型(Pooled、inside、between),并且没有进一步考虑尝试用它们中的每一个提取缺失的数据;但是我不知道该怎么做。
编辑2:我需要的不是如何确定要使用哪个模型,而是如何获取模型的缺失值(从而使数据集更加平衡)。
r - 在 R 中的不平衡面板数据中创建滞后变量
我想在一个组中创建一个包含上一年变量值的变量。
value_lagged
如果组中缺少上一年,则应该丢失 - 因为它是组中的第一个日期(如第 4、7 行),或者因为数据中存在年份差距(如第 5 行)。此外,value_lagged
当当前时间丢失时应该丢失(如第 2 行)。
这给出了:
现在,在 R 中,我使用data.table
包
它很快,但对我来说似乎有点容易出错。我想知道使用 , 或任何其他包是否有更好的data.table
选择dplyr
。非常感谢!
在Stata
中,一个人会这样做:
r - 在 R 中使用 longRPart 包
我想在 R 中使用 longRPart 包。但它似乎已从 CRAN 中删除。有什么方法可以使用这个包来分析纵向数据集?
当我输入 install.packages("longRPart") 时,我收到一条警告消息,指出包 'longRPart' 不可用(对于 R 版本 3.1.1)
有没有其他方法可以使用这个包?
r - 年份变量应该是 R 面板数据中的因子还是数字?
我有一个面板数据集,其中每两年从 2004 年到 2010 年跟踪医院。数据在 Stata 中,但我将其带到 R 中。最初变量year
(2004, 2006, 2008, 2010) 和t
(1=2004, 2=2006 等) 是整数,但后来我将它们转换为如下因子:
同样对于 t 时间变量也是如此。
但是我很困惑,我的问题是是否将其作为整数year
或t
数字变量或将其转换为面板数据的因子,以及上述命令是否是转换为因子的正确方法?
r - R:在纵向数据中插入缺失的日期而不丢失信息
我在数据表中有一个纵向数据集,类似于下面的简化示例:
ID
是面板变量,它是完全唯一的,没有国家之间的重叠。日期范围,仅查看唯一值,范围从2012-10-23
到2014-09-30
。显然,每个 的范围Date
并不相同ID
。此外,可能存在缺失值。为了有一个平衡的面板,我想填补我的数据集的空白。
根据@akron 的建议,在这里调整答案,我执行以下操作:
使用该选项all.y = TRUE
,R 会为 中的每个缺失日期添加行data
。但是,现在除了ID
和之外的所有字段Date
都是空白的,如果该行之前在 中不存在data
。也就是说,我的数据看起来像这样
我确实希望Value
成为 NA,因为它丢失了。但是,由于Country
给定的 不会更改ID
,因此我希望填写该字段。
matlab - Matlab中的滞后不平衡面板数据集
我在 Matlab 中有一个不平衡的面板数据集,我需要滞后。不平衡的面板数据集很容易在 R 中与plm
包一起使用。Matlab中是否有类似的功能?这是一个玩具示例:
对于 Var1 的每个实例,我想将 Var3 的值滞后一年。请注意,对于 Var1=3,1994 年没有值。因此,我想要以下内容:
在 Matlab 中是否有一种简单的方法可以做到这一点?
bayesian - 如何使用pymc在贝叶斯模型中进行面板数据分析
每个人。我有一个关于如何使用 pymc 在贝叶斯模型中进行面板数据分析的问题。数据是这样的:
现在,我有 N 个用户使用 T 次样本 (N≫T),以及自变量 (x1,x2,x3) 和因变量 (Y)。
现在,我想在集体层面分析 X 对 Y 的影响。以最简单的线性回归为例,参照《贝叶斯计量经济学导论》(PP.145)一书,一般模型常写为:
$$ y_{it} = x_{it}{\beta}+ w_{it}{b_i}+ {u_{it}}, i = 1,...,n;\;\;t = 1,。 ..,T $$
其中,$i$ 表示用户;$t$ 代表时间;${\beta}$ 在 $i$ 之间没有差异,称为固定效应;${b_i}$ 与 $i$ 不同,称为随机效应。
在贝叶斯看来,${\beta}$ 和 ${b_i}$ 都被视为随机变量。所以,设 ${\beta} $~$ N({\beta}_0,{\beta}_1)$, 和 ${b_i} $~$ N({\lambda_0},{\lambda_1})$
但是,这是理论上的一般思想,但我对如何在 pymc 中建模和拟合它没有任何想法。
感谢任何人给我一些灵感或示例代码。