问题标签 [panel-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
12016 浏览

r - 面板数据 R 中的多重共线性检验

我正在使用plm包运行面板数据回归,R并希望控制解释变量之间的多重共线性。
我知道 -package 中有这个vif()功能car,但据我所知,它不能处理面板数据输出。
可以进行其他诊断,plm例如单位根检验,但我没有找到计算多重共线性的方法。

有没有办法计算类似的测试vif,或者我可以将每个变量视为时间序列,省略面板信息并使用car包运行测试?

我不能透露数据,但问题应该与所有面板数据模型有关。
该维度大约是 1,000 个观测值,超过 50 个时间段。
我使用的代码如下所示:

接着

返回错误。


先感谢您。

0 投票
2 回答
1162 浏览

r - 来自不平衡面板数据的 R 样本

我正在处理不平衡的面板数据,我想从中抽取一个随机样本,该样本不受每单位不同观察次数的影响。例如,在下面的代码中,IBM 被选中的可能性是 GOOG 的两倍,被选中的可能性是 MSFT 的五倍。有没有办法对这些数据进行抽样,就好像每家公司/年份都有相同的被选中的概率?可能通过使用采样包?

0 投票
1 回答
73 浏览

r - 将传记数据转化为面板数据

我有 1600 多人的传记资料。这些数据包括他们的性别、出生年份、家乡等,以及他们从开始工作那年起的职业轨迹。我正在尝试将其转换为面板数据,以便了解他们的工作场所自从他们开始工作以来发生了怎样的变化。我对这个数据集有以下问题:

1)如何将其转换为面板数据集?我想要的每个人(id)的最佳格式是:

2) 如果该人的职位重叠,我如何保存信息?例如,此人可以同时从事工作 3 和工作 5。我希望以后只使用比另一个更高的工作,但同时我想尽可能多地保存信息。

0 投票
0 回答
57 浏览

pandas - 按程序将区间数据转换为横截面数据

我正在做一个项目,我有一个带有开始和结束时间戳的事件数据库。我想将数据用作横截面数据。

天真的解决方案是迭代自纪元以来的每个时间段,并根据每个记录的间隔检查它。

一定有更好的方法。

我与语言无关,但我偏爱 python 进行数据分析。

哪些模块可以帮助我在程序上转换这些数据?

编辑:

以下是一些示例数据:

我想将其更改为如下数据:

...

这只是一个示例,我计划使用 unix 纪元时间戳,因此自 1970 年以来每秒迭代一次是不可行的。

0 投票
2 回答
2247 浏览

r - 对 xts 数据进行排序,使其看起来像 R 中的面板数据

我需要使用 R 的“PerformanceAnalytics”包并使用这个包,它需要我将数据转换为 xts 数据。可以从此链接下载数据:https ://drive.google.com/file/d/0B8usDJAPeV85elBmWXFwaXB4WUE/edit?usp=sharing 。因此,我使用以下命令创建了 xts 数据:

但是这样做之后,它会丢失面板数据结构。我试图对xts数据进行排序以使其恢复为面板数据形式,但失败了。

谁能帮我重新组织xts数据,使其看起来像面板数据。我需要按公司 ID(gvkey)和数据(datadate)对它们进行排序。

0 投票
1 回答
114 浏览

dataset - 如何合并数据以形成面板?

我有两个数据框。数据框“天气”如下所示:

而且,数据框“Regularity”如下所示:

我想以 R 的形式创建一个面板数据框:

我尝试过合并和重塑2,但徒劳无功。我将非常感谢任何帮助。谢谢你。

0 投票
2 回答
1152 浏览

r - 在 R 中重塑时间序列数据

我有来自国际货币基金组织 IFS 的季度时间序列经济数据,我需要这些数据进行长篇分析。

现在,行是每个国家/地区的变量,列是时间,所以看起来像这样。

我需要把它变成长格式:

当 ID 变量和测量变量都在行中时,我无法找到关于使用 reshape 的任何建议。

0 投票
1 回答
122 浏览

r - 从时间相关面板数据创建数字序列

所以我有一个数据集,其中有学生在课堂上的年份,以及他们在一年中的哪个季度,所以 2002 年是 4 次,它有季度 1、2、3、4,如下所示:

这给了我这个

我想生成一个序列,在该序列中创建一个累积季度数的新变量,如果必须合并年份和季度并不难,但是我如何告诉它执行类似的序列

给我这个

我已经尝试过代表命令和序列等,但我不知道如何告诉它在每个参与者之后重新开始编号。季度数因学生而异,我不需要知道他们从哪个季度开始,这是大学数据,所以我想他们可以从第 2 季度开始(我还没有查看所有关于起始值的整个数据集6K 左右的参与者)但我只需要它来累积。我希望这个问题是适当的,并且我正确地格式化了我的问题。

0 投票
3 回答
807 浏览

r - 对不平衡的面板数据集进行子集化以在 R 中至少有 2 个连续的观察值

我在 R 中有一个不平衡的面板数据集。以下将作为示例:

现在,我需要year对每个name. 因此,我想删除第 4、5 和 8 行。如何在 R 中最好地做到这一点?

编辑: 感谢下面的评论,我可以更清楚一点。name如果我对=Cyear=有额外的观察(第 9 行)2004,我希望将第 8 行和第 9 行与其他行一起保留。

0 投票
1 回答
601 浏览

r - 使用 NA 填充 PLM 模型的拟合值

我有以下数据集

NA在某些变量中包含s。我使用plm包来估计以下模型:

现在,我想提取拟合值。据我了解,最好的方法是从我的响应变量中减去残差var1(因为没有函数可以获取拟合值pml参见此处):

但它排除了带有NAs 的行。我想NA在原始数据集有NAs 的地方用 s 填充拟合值。必须有一种聪明而简单的方法来将NAs 从填充dt到我的拟合值,但我看不到它。非常感谢任何帮助!