问题标签 [panel-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
105 浏览

r - 如何删除数据访问次数少于 2 次的患者

我有一个纵向数据集,每次访问结构为 1 行。
数字患者 ID 号表示唯一的患者。

如何从我的数据集中删除少于 2 次观察的所有患者?

所以对于这个例子,我想删除病人105110的行。

例子

0 投票
1 回答
52 浏览

r - 通过唯一值对面板数据进行子集化

我想根据特定标准对面板数据进行细分,并对每个细分进行汇总统计。数据:

从上面的示例中,我想将商店分为进入者、退出者和现任者。因此,例如,我想了解在此期间有多少商店退出市场,应该如下所示:

已进入市场:

并在整个期间保持在职:

我对 R 的经验不足以执行此类任务,因此将不胜感激。

0 投票
1 回答
2919 浏览

r - 使用 plm 方法进行预测

我正在使用 plm 包来估计面板数据上的随机效应模型。阅读这个关于 plm 包中预测的问题让我有些怀疑。它究竟是如何工作的?我尝试了 3 种替代方法,它们给出了不同的解决方案。为什么 ?

0 投票
1 回答
821 浏览

stata - 如何导出Stata xtcsd测试结果?

我想将 12 个面板数据集的横截面相关性测试结果导出到表格中,以便将它们与使用不同软件完成的类似测试进行比较。下面是xtcsd帮助页面中的回归和测试指令示例(不幸的是,示例数据集不可用,但页面中类似的示例数据集 tbl15-1.dta可用xttest2)。下面的说明将帮助您了解我想要实现的目标:

要显示测试统计信息,我可以使用

我如何访问该统计数据的 p 值?

我找到了如何使用命令导出估计结果esttab。如何将测试结果导出到 Stata 中的文件?

在@Maarten Buis 下面对 p 值的评论之后,这是我使用低级文件访问将测试结果导出到 csv 文件的方式:

0 投票
1 回答
2436 浏览

r - 在 R 中使用大量数据创建面板数据

我目前在将大量数据组合成面板数据时遇到问题。我发现这个解决方案可以帮助我获得“更小”的解决方案:面板数据,但我无法将其应用于“更大”的格式。

我将尝试制作一个编码示例:来自包'datasets':

每个数据框包含 43 个地区中每个地区的不同值。我给每个地区一个唯一的 id(1 到 43)。这 43 个地区与数据集 WorldPhones 中给出的 7 个地区(大洲)相当。每个数据框仅包含每个地区和每年的一个变量。假设 df_1 包含变量 X1,df_2 包含 X2 等等。我想把这些数据变成“长”格式,这样想:

不幸的是,我真的不知道该怎么做,除了“蛮力”,它会写下“它”43次。

0 投票
1 回答
385 浏览

r - 如何根据变量的阈值拆分 R 中的面板数据记录?

我有记录入院日期和住院天数的住院数据:

我想创建一个每年在医院度过的天数的数据集,因此我需要处理像 ID 3 和 ID 4 这样的病例,他们在医院的住院时间超过了年底,而 ID 4,他们在医院的住院时间超过一年。还有一个问题,有些人明年确实有记录,我想在发生这种情况的时候加上“盈余”天数。

到目前为止,我已经提出了这个解决方案:

但是,我想不出一种方法来获得那些超过年底的“剩余”天数,并将它们分配给明年开始的新记录。任何人都可以指出一个好的解决方案吗?我使用 dplyr,因此特别欢迎使用该软件包的解决方案,但如果需要,我愿意尝试任何其他工具。

0 投票
1 回答
1688 浏览

r - 使用 R 中的面板数据集将每日股票收益转换为年度收益

我在 R 中有一个面板数据集,其中包含每日股票收益。数据如下:

如何将这些数据转换为每家公司每年的年度股票收益?我尝试将数据转换为xts对象并尝试使用Return.annualized函数但它不起作用。

0 投票
1 回答
229 浏览

r - 从面板数据中提取 R 数据

我想从中提取值的表中有一个很长的时间序列。

该小组每天都有观察结果,但有些不适用。我想将每个横截面的最后一个非 NA 值提取到一个新的时间序列中。它应该转到相同的横截面,并用提取的值填充该横截面内的所有观察值。即,新的时间序列将由堆叠的横截面组成,每个 t 中都有数据。

我在下面的结构中做了一个示例,其中 x 是我要从中提取数据的系列,而 NEW 是我要创建的新系列。

我还创建了一个 pdata.frame,其中在同一行中指定了横截面和时间 ID。

我是 R 新手,所以我很感激你的建议。

*编辑表格结构:

0 投票
2 回答
2619 浏览

r - 带 plm 包的权重

我的数据框如下所示:

我想运行以下加权回归:

但我不相信 plm 包允许重量。我正在从下面的模型中寻找系数的答案:

但是,我正在寻找 plm 包的答案,因为使用 plm 获得更大数据集和许多组的内部估计器的系数要快得多。

0 投票
1 回答
355 浏览

r - R:如何组合几个时间段

我有一个面板数据,数据框有三个人,每个人有4个时期的观察,

它应该看起来像这样

现在我想得到每两个连续时间段的平均值(即将 t=1 和 t=2 组合为一个时间段,其值是两者的平均值),并将时间序列缩短为 2 个时间段。结果应该是这样的

我该如何管理?

我看到有人已经在stackoverflow上问过同样的问题,但它在mysql中(这里如何组合几个时间跨度),我想知道R中是否有解决方案。(我无法阅读mysql代码..)

提前感谢,非常感谢!

EDIT: @dimitris_ps has already given an answer for the problem, and I wonder whether there is a more generic solution. what if the data frame is like below and has 50 variables?