问题标签 [panel-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在 R 中查看 plm 输出中的所有估计值
我正在尝试plm
查看正面、负面和中性类别对股票价格的影响。
如果我运行模型,输出仅显示两个估计值(中性和正)。我怎样才能看到负类的估计?我认为这与傻瓜有关。但是,负类不应该至少有一行“拦截”吗?
谢谢你!
r - 面板数据的动态时间规整 (dtw)
对于以下数据框,我使用以下代码计算了成本矩阵。最初,我创建了一个矩阵,其中 [i,j] 条目都是 10。然后我使用 dtw 函数填充下三角部分来计算距离。
如何将“distmx”矩阵的上三角部分设为空白。我的意思是我想删除矩阵“distmx”的上三角部分的 10。
对于这样的数据集(面板数据集),我如何选择查询和参考系列来绘制它?
成本矩阵
r - 从R中的面板数据中的另一个数据框中多次插入日期
我有一组面板数据,我需要从另一个数据框中插入日期。
以上是日期的数据。下面是我的数据集,每周运行 1 到 40 次观察。
所以我想从 allweeks 数据框中插入上述面板数据的每个日期 40 次,以便结果看起来像这样:
任何帮助将不胜感激!
r - 如果变量等于 R 中的特定字符串,则进行条件绘图
我有一个类似于以下格式的时间序列面板数据集,其中 V1 是字符(这里是 A、B、C...),V2 是数字(5,8,6...)。我在 V1 中有 65 个不同的项目(总共大约 50000 个奇怪的观察值)。我正在尝试找到一种方法来绘制 V2 提供的 V1=A 或 B 等等。我可以简单地做的是plot(V1[1:1065])
,plot([V1:1066:2085])
等等,但我一直在寻找一种强大的方法来做到这一点。尝试过这样的事情:
但由于 R 中的 'if' 不接受向量,它会给出错误消息,"the condition has length > 1 and only the first element will be used"
有人可以提出一些建议吗?
r - R中的PLM与时不变变量
我正在尝试分析一个面板数据,其中包括 45 年来收集的每个美国州的观察结果。我有两个随时间变化的预测变量(A,B)和一个不变的(C)。我特别有兴趣了解 C 对因变量 Y 的影响,同时控制 A 和 B,以及跨状态和时间的差异。
这是我拥有的模型,在 R 中使用 plm 包。
我的理由是,对于时间不变的变量,我应该使用随机而不是固定效应模型。我的问题是:我的模型和思维是否正确?
提前谢谢你的帮助。
regression - 如何合并 3 个文件以创建面板数据?
我有三个不同的 Stata 文件(每个文件用于三个不同的年份),我想估计一个固定效应回归。我的猜测是我需要合并这些文件以测试我的回归,但我该怎么做呢?如何在每个文件中为同一变量提供时间标识?
r - 根据定义的连续观察次数,在 R 中的面板数据中删除变量
我对 R 很陌生,我的问题如下:
我有一组像这样按时间序列组织的面板数据(仅显示部分):
例如,使用 B 组是没有意义的,因为有太多的观察缺失。排名系统不提供排名低于 40 的数据。所以我想通过删除没有至少 8 周连续观察的列(变量)来清理(例如本例中的团队 A、B 和 D)。因此 D 不符合要求,因为从 2010-02-20 开始的一周有间隔。请记住,我有超过 1000 列。
我以前试过这个,但它没有给我想要的东西,不幸的是我不够熟练,无法修改代码以满足我的需要。
我能想到的一些可能的解决方案:
子集每个变量的具有 8 个或更多连续观测值的部分
如果连续运行 8 个 obs 包含 NA,则设置观察值 = NA,然后删除只有 NA 的列,因为不满足最少 8 周要求的列将只有 NA 值(我希望你明白我的意思)
只是出于兴趣,如果数据以长格式组织,做同样的事情会更困难吗?
有什么建议么?
r - 面板数据中合并回归模型的模型预测
我正在尝试生成一个预测模型,在该模型中我每年(基于前几年)执行多个汇总回归,从而允许系数随时间变化。(这在提供的示例数据中可能没有意义,但在我的示例中它是在实践中完成的)。
到目前为止,这是我的想法:我将代码调整为 plm 包中的可重现示例:
数据按以下方式(面板)构建,并以公司、年份为索引。
这是我的代码:
不幸的是,我的代码不起作用,我收到以下错误:
理想情况下,我想以与原始 Grunfeld 数据相同的结构将我的预测/预测存储在 $Grunfeld$Forecast 中。但是,我在使用列表时遇到了很多困难,并且经常无法正确处理它们并将结果存储在原始数据旁边的向量中。这一点至关重要,因为在我自己的样本中,有很多缺失数据(NA),我只能在有限的子集上使用预测函数。您如何以所需的方式排列数据?
这是获得具有不同斜率的条件预测(在一年中)并以与原始数据相同的方式存储它们的正确方法,还是我不知道有更有效的方法?
r - 按年份对面板数据(数据框)进行 Winsorizing 并针对某些条件进行修剪
我正在尝试对面板数据和每年进行 Winsorize(用与平均值相差 2 或 3 个标准差的值替换异常值)。我安装了包含这样一个功能的 robustHD 包,但是我无法在我的数据集上实现它。
我的数据集看起来类似于 Grunfeld(尽管我有 NA)在同一年的不同公司。(1935-1954)
我现在想做的是只对所有公司的某些列(即inv和value)进行winsorize,并将其存储在具有相同结构的数据框中。我尝试了以下代码:
目标基本上是获得原始数据帧的 Winsorized 副本(所有结构都以相同的方式)。
如下所述,plyr 是拆分数据帧和应用函数的好方法,但我无法让它工作。
r - R中的子集面板数据
我正在尝试对面板数据集进行子集化,以仅读取每个“区域”的前 855 个观察值。区域列有 65 个不同的区域,每个区域有 1070 个观测值。由此,我想减少数据集以包含所有 65 个区域,但只有它们的前 855 个观察值(相应地减少所有其他变量)。
我能得到的最接近的方法是使用新变量为每个区域定义数据,然后对其进行子集化,如下所示:
等等....然后服用
然后将其组合形成整个数据集并根据 Regions 进行排列(如原始数据集中的排列)
FinalDataset <- cbind(Sample1,Sample2
)
但是,当然,这不是一种有效的方法,我期待得到一些帮助来更有效地完成它。我希望我正确地解释了这个问题。