问题标签 [panel-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
941 浏览

r - 在 R 中查看 plm 输出中的所有估计值

我正在尝试plm查看正面、负面和中性类别对股票价格的影响。

如果我运行模型,输出仅显示两个估计值(中性和正)。我怎样才能看到负类的估计?我认为这与傻瓜有关。但是,负类不应该至少有一行“拦截”吗?

谢谢你!

0 投票
0 回答
247 浏览

r - 面板数据的动态时间规整 (dtw)

对于以下数据框,我使用以下代码计算了成本矩阵。最初,我创建了一个矩阵,其中 [i,j] 条目都是 10。然后我使用 dtw 函数填充下三角部分来计算距离。

如何将“distmx”矩阵的上三角部分设为空白。我的意思是我想删除矩阵“distmx”的上三角部分的 10。

对于这样的数据集(面板数据集),我如何选择查询和参考系列来绘制它?

成本矩阵

0 投票
1 回答
34 浏览

r - 从R中的面板数据中的另一个数据框中多次插入日期

我有一组面板数据,我需要从另一个数据框中插入日期。

以上是日期的数据。下面是我的数据集,每周运行 1 到 40 次观察。

所以我想从 allweeks 数据框中插入上述面板数据的每个日期 40 次,以便结果看起来像这样:

任何帮助将不胜感激!

0 投票
1 回答
2206 浏览

r - 如果变量等于 R 中的特定字符串,则进行条件绘图

我有一个类似于以下格式的时间序列面板数据集,其中 V1 是字符(这里是 A、B、C...),V2 是数字(5,8,6...)。我在 V1 中有 65 个不同的项目(总共大约 50000 个奇怪的观察值)。我正在尝试找到一种方法来绘制 V2 提供的 V1=A 或 B 等等。我可以简单地做的是plot(V1[1:1065])plot([V1:1066:2085])等等,但我一直在寻找一种强大的方法来做到这一点。尝试过这样的事情:

但由于 R 中的 'if' 不接受向量,它会给出错误消息,"the condition has length > 1 and only the first element will be used"

有人可以提出一些建议吗?

0 投票
1 回答
852 浏览

r - R中的PLM与时不变变量

我正在尝试分析一个面板数据,其中包括 45 年来收集的每个美国州的观察结果。我有两个随时间变化的预测变量(A,B)和一个不变的(C)。我特别有兴趣了解 C 对因变量 Y 的影响,同时控制 A 和 B,以及跨状态和时间的差异。

这是我拥有的模型,在 R 中使用 plm 包。

我的理由是,对于时间不变的变量,我应该使用随机而不是固定效应模型。我的问题是:我的模型和思维是否正确?

提前谢谢你的帮助。

0 投票
1 回答
1384 浏览

regression - 如何合并 3 个文件以创建面板数据?

我有三个不同的 Stata 文件(每个文件用于三个不同的年份),我想估计一个固定效应回归。我的猜测是我需要合并这些文件以测试我的回归,但我该怎么做呢?如何在每个文件中为同一变量提供时间标识?

0 投票
1 回答
1133 浏览

r - 根据定义的连续观察次数,在 R 中的面板数据中删除变量

我对 R 很陌生,我的问题如下:

我有一组像这样按时间序列组织的面板数据(仅显示部分):

例如,使用 B 组是没有意义的,因为有太多的观察缺失。排名系统不提供排名低于 40 的数据。所以我想通过删除没有至少 8 周连续观察的列(变量)来清理(例如本例中的团队 A、B 和 D)。因此 D 不符合要求,因为从 2010-02-20 开始的一周有间隔。请记住,我有超过 1000 列。

我以前试过这个,但它没有给我想要的东西,不幸的是我不够熟练,无法修改代码以满足我的需要。

我能想到的一些可能的解决方案:

  1. 子集每个变量的具有 8 个或更多连续观测值的部分

  2. 如果连续运行 8 个 obs 包含 NA,则设置观察值 = NA,然后删除只有 NA 的列,因为不满足最少 8 周要求的列将只有 NA 值(我希望你明白我的意思)

只是出于兴趣,如果数据以长格式组织,做同样的事情会更困难吗?

有什么建议么?

0 投票
1 回答
3223 浏览

r - 面板数据中合并回归模型的模型预测

我正在尝试生成一个预测模型,在该模型中我每年(基于前几年)执行多个汇总回归,从而允许系数随时间变化。(这在提供的示例数据中可能没有意义,但在我的示例中它是在实践中完成的)。

到目前为止,这是我的想法:我将代码调整为 plm 包中的可重现示例:

数据按以下方式(面板)构建,并以公司、年份为索引。

这是我的代码:

不幸的是,我的代码不起作用,我收到以下错误:

理想情况下,我想以与原始 Grunfeld 数据相同的结构将我的预测/预测存储在 $Grunfeld$Forecast 中。但是,我在使用列表时遇到了很多困难,并且经常无法正确处理它们并将结果存储在原始数据旁边的向量中。这一点至关重要,因为在我自己的样本中,有很多缺失数据(NA),我只能在有限的子集上使用预测函数。您如何以所需的方式排列数据?

这是获得具有不同斜率的条件预测(在一年中)并以与原始数据相同的方式存储它们的正确方法,还是我不知道有更有效的方法?

0 投票
1 回答
2592 浏览

r - 按年份对面板数据(数据框)进行 Winsorizing 并针对某些条件进行修剪

我正在尝试对面板数据和每年进行 Winsorize(用与平均值相差 2 或 3 个标准差的值替换异常值)。我安装了包含这样一个功能的 robustHD 包,但是我无法在我的数据集上实现它。

我的数据集看起来类似于 Grunfeld(尽管我有 NA)在同一年的不同公司。(1935-1954)

我现在想做的是只对所有公司的某些列(即inv和value)进行winsorize,并将其存储在具有相同结构的数据框中。我尝试了以下代码:

目标基本上是获得原始数据帧的 Winsorized 副本(所有结构都以相同的方式)。

如下所述,plyr 是拆分数据帧和应用函数的好方法,但我无法让它工作。

0 投票
2 回答
1765 浏览

r - R中的子集面板数据

我正在尝试对面板数据集进行子集化,以仅读取每个“区域”的前 855 个观察值。区域列有 65 个不同的区域,每个区域有 1070 个观测值。由此,我想减少数据集以包含所有 65 个区域,但只有它们的前 855 个观察值(相应地减少所有其他变量)。

我能得到的最接近的方法是使用新变量为每个区域定义数据,然后对其进行子集化,如下所示:

等等....然后服用

然后将其组合形成整个数据集并根据 Regions 进行排列(如原始数据集中的排列)

FinalDataset <- cbind(Sample1,Sample2)

但是,当然,这不是一种有效的方法,我期待得到一些帮助来更有效地完成它。我希望我正确地解释了这个问题。