问题标签 [panel-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 面板数据 R 中的多重共线性检验
我正在使用plm
包运行面板数据回归,R
并希望控制解释变量之间的多重共线性。
我知道 -package 中有这个vif()
功能car
,但据我所知,它不能处理面板数据输出。
可以进行其他诊断,plm
例如单位根检验,但我没有找到计算多重共线性的方法。
有没有办法计算类似的测试vif
,或者我可以将每个变量视为时间序列,省略面板信息并使用car
包运行测试?
我不能透露数据,但问题应该与所有面板数据模型有关。
该维度大约是 1,000 个观测值,超过 50 个时间段。
我使用的代码如下所示:
接着
返回错误。
先感谢您。
r - 来自不平衡面板数据的 R 样本
我正在处理不平衡的面板数据,我想从中抽取一个随机样本,该样本不受每单位不同观察次数的影响。例如,在下面的代码中,IBM 被选中的可能性是 GOOG 的两倍,被选中的可能性是 MSFT 的五倍。有没有办法对这些数据进行抽样,就好像每家公司/年份都有相同的被选中的概率?可能通过使用采样包?
r - 将传记数据转化为面板数据
我有 1600 多人的传记资料。这些数据包括他们的性别、出生年份、家乡等,以及他们从开始工作那年起的职业轨迹。我正在尝试将其转换为面板数据,以便了解他们的工作场所自从他们开始工作以来发生了怎样的变化。我对这个数据集有以下问题:
1)如何将其转换为面板数据集?我想要的每个人(id)的最佳格式是:
2) 如果该人的职位重叠,我如何保存信息?例如,此人可以同时从事工作 3 和工作 5。我希望以后只使用比另一个更高的工作,但同时我想尽可能多地保存信息。
pandas - 按程序将区间数据转换为横截面数据
我正在做一个项目,我有一个带有开始和结束时间戳的事件数据库。我想将数据用作横截面数据。
天真的解决方案是迭代自纪元以来的每个时间段,并根据每个记录的间隔检查它。
一定有更好的方法。
我与语言无关,但我偏爱 python 进行数据分析。
哪些模块可以帮助我在程序上转换这些数据?
编辑:
以下是一些示例数据:
我想将其更改为如下数据:
...
这只是一个示例,我计划使用 unix 纪元时间戳,因此自 1970 年以来每秒迭代一次是不可行的。
r - 对 xts 数据进行排序,使其看起来像 R 中的面板数据
我需要使用 R 的“PerformanceAnalytics”包并使用这个包,它需要我将数据转换为 xts 数据。可以从此链接下载数据:https ://drive.google.com/file/d/0B8usDJAPeV85elBmWXFwaXB4WUE/edit?usp=sharing 。因此,我使用以下命令创建了 xts 数据:
但是这样做之后,它会丢失面板数据结构。我试图对xts
数据进行排序以使其恢复为面板数据形式,但失败了。
谁能帮我重新组织xts
数据,使其看起来像面板数据。我需要按公司 ID(gvkey)和数据(datadate)对它们进行排序。
dataset - 如何合并数据以形成面板?
我有两个数据框。数据框“天气”如下所示:
而且,数据框“Regularity”如下所示:
我想以 R 的形式创建一个面板数据框:
我尝试过合并和重塑2,但徒劳无功。我将非常感谢任何帮助。谢谢你。
r - 在 R 中重塑时间序列数据
我有来自国际货币基金组织 IFS 的季度时间序列经济数据,我需要这些数据进行长篇分析。
现在,行是每个国家/地区的变量,列是时间,所以看起来像这样。
我需要把它变成长格式:
当 ID 变量和测量变量都在行中时,我无法找到关于使用 reshape 的任何建议。
r - 从时间相关面板数据创建数字序列
所以我有一个数据集,其中有学生在课堂上的年份,以及他们在一年中的哪个季度,所以 2002 年是 4 次,它有季度 1、2、3、4,如下所示:
这给了我这个
我想生成一个序列,在该序列中创建一个累积季度数的新变量,如果必须合并年份和季度并不难,但是我如何告诉它执行类似的序列
给我这个
我已经尝试过代表命令和序列等,但我不知道如何告诉它在每个参与者之后重新开始编号。季度数因学生而异,我不需要知道他们从哪个季度开始,这是大学数据,所以我想他们可以从第 2 季度开始(我还没有查看所有关于起始值的整个数据集6K 左右的参与者)但我只需要它来累积。我希望这个问题是适当的,并且我正确地格式化了我的问题。
r - 对不平衡的面板数据集进行子集化以在 R 中至少有 2 个连续的观察值
我在 R 中有一个不平衡的面板数据集。以下将作为示例:
现在,我需要year
对每个name
. 因此,我想删除第 4、5 和 8 行。如何在 R 中最好地做到这一点?
编辑:
感谢下面的评论,我可以更清楚一点。name
如果我对=C
和year
=有额外的观察(第 9 行)2004
,我希望将第 8 行和第 9 行与其他行一起保留。
r - 使用 NA 填充 PLM 模型的拟合值
我有以下数据集
NA
在某些变量中包含s。我使用plm
包来估计以下模型:
现在,我想提取拟合值。据我了解,最好的方法是从我的响应变量中减去残差var1
(因为没有函数可以获取拟合值pml
(参见此处):
但它排除了带有NA
s 的行。我想NA
在原始数据集有NA
s 的地方用 s 填充拟合值。必须有一种聪明而简单的方法来将NA
s 从填充dt
到我的拟合值,但我看不到它。非常感谢任何帮助!