问题标签 [panel-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何删除数据访问次数少于 2 次的患者
我有一个纵向数据集,每次访问结构为 1 行。
数字患者 ID 号表示唯一的患者。
如何从我的数据集中删除少于 2 次观察的所有患者?
所以对于这个例子,我想删除病人105和110的行。
例子
r - 通过唯一值对面板数据进行子集化
我想根据特定标准对面板数据进行细分,并对每个细分进行汇总统计。数据:
从上面的示例中,我想将商店分为进入者、退出者和现任者。因此,例如,我想了解在此期间有多少商店退出市场,应该如下所示:
已进入市场:
并在整个期间保持在职:
我对 R 的经验不足以执行此类任务,因此将不胜感激。
r - 使用 plm 方法进行预测
我正在使用 plm 包来估计面板数据上的随机效应模型。阅读这个关于 plm 包中预测的问题让我有些怀疑。它究竟是如何工作的?我尝试了 3 种替代方法,它们给出了不同的解决方案。为什么 ?
stata - 如何导出Stata xtcsd测试结果?
我想将 12 个面板数据集的横截面相关性测试结果导出到表格中,以便将它们与使用不同软件完成的类似测试进行比较。下面是xtcsd
帮助页面中的回归和测试指令示例(不幸的是,示例数据集不可用,但页面中类似的示例数据集 tbl15-1.dta可用xttest2
)。下面的说明将帮助您了解我想要实现的目标:
要显示测试统计信息,我可以使用
我如何访问该统计数据的 p 值?
我找到了如何使用命令导出估计结果esttab
。如何将测试结果导出到 Stata 中的文件?
在@Maarten Buis 下面对 p 值的评论之后,这是我使用低级文件访问将测试结果导出到 csv 文件的方式:
r - 在 R 中使用大量数据创建面板数据
我目前在将大量数据组合成面板数据时遇到问题。我发现这个解决方案可以帮助我获得“更小”的解决方案:面板数据,但我无法将其应用于“更大”的格式。
我将尝试制作一个编码示例:来自包'datasets':
每个数据框包含 43 个地区中每个地区的不同值。我给每个地区一个唯一的 id(1 到 43)。这 43 个地区与数据集 WorldPhones 中给出的 7 个地区(大洲)相当。每个数据框仅包含每个地区和每年的一个变量。假设 df_1 包含变量 X1,df_2 包含 X2 等等。我想把这些数据变成“长”格式,这样想:
不幸的是,我真的不知道该怎么做,除了“蛮力”,它会写下“它”43次。
r - 如何根据变量的阈值拆分 R 中的面板数据记录?
我有记录入院日期和住院天数的住院数据:
我想创建一个每年在医院度过的天数的数据集,因此我需要处理像 ID 3 和 ID 4 这样的病例,他们在医院的住院时间超过了年底,而 ID 4,他们在医院的住院时间超过一年。还有一个问题,有些人明年确实有记录,我想在发生这种情况的时候加上“盈余”天数。
到目前为止,我已经提出了这个解决方案:
但是,我想不出一种方法来获得那些超过年底的“剩余”天数,并将它们分配给明年开始的新记录。任何人都可以指出一个好的解决方案吗?我使用 dplyr,因此特别欢迎使用该软件包的解决方案,但如果需要,我愿意尝试任何其他工具。
r - 使用 R 中的面板数据集将每日股票收益转换为年度收益
我在 R 中有一个面板数据集,其中包含每日股票收益。数据如下:
如何将这些数据转换为每家公司每年的年度股票收益?我尝试将数据转换为xts
对象并尝试使用Return.annualized
函数但它不起作用。
r - 从面板数据中提取 R 数据
我想从中提取值的表中有一个很长的时间序列。
该小组每天都有观察结果,但有些不适用。我想将每个横截面的最后一个非 NA 值提取到一个新的时间序列中。它应该转到相同的横截面,并用提取的值填充该横截面内的所有观察值。即,新的时间序列将由堆叠的横截面组成,每个 t 中都有数据。
我在下面的结构中做了一个示例,其中 x 是我要从中提取数据的系列,而 NEW 是我要创建的新系列。
我还创建了一个 pdata.frame,其中在同一行中指定了横截面和时间 ID。
我是 R 新手,所以我很感激你的建议。
*编辑表格结构:
r - 带 plm 包的权重
我的数据框如下所示:
我想运行以下加权回归:
但我不相信 plm 包允许重量。我正在从下面的模型中寻找系数的答案:
但是,我正在寻找 plm 包的答案,因为使用 plm 获得更大数据集和许多组的内部估计器的系数要快得多。
r - R:如何组合几个时间段
我有一个面板数据,数据框有三个人,每个人有4个时期的观察,
它应该看起来像这样
现在我想得到每两个连续时间段的平均值(即将 t=1 和 t=2 组合为一个时间段,其值是两者的平均值),并将时间序列缩短为 2 个时间段。结果应该是这样的
我该如何管理?
我看到有人已经在stackoverflow上问过同样的问题,但它在mysql中(这里如何组合几个时间跨度),我想知道R中是否有解决方案。(我无法阅读mysql代码..)
提前感谢,非常感谢!
EDIT: @dimitris_ps has already given an answer for the problem, and I wonder whether there is a more generic solution. what if the data frame is like below and has 50 variables?