问题标签 [panel-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
55 浏览

mysql - 计算mysql中面板数据的时间差

我有一个看起来像这样的表(称为“会话”):

我想使用 mysql 来计算每个用户在每个活动上花费的秒数(“持续时间”),这是给定一天给定 user_id 的日期时间之间的差异,得到:

我可以使它适用于系列,但不适用于面板。谢谢!

0 投票
2 回答
1601 浏览

r - 运行固定效应 plm R - 城市、年份、季度数据

我正在尝试使用 plm 包在 R 中使用固定效果来估计模型。我的数据如下所示,它是公司、城市、年份、季度级别。我按年按公司和城市级别观察销售和收入中的每一个。我的回归是收入~销售额。这是按收入计算的销售额,但希望控制公司和城市特定的不可观察数据。我的实际数据集中有 1000 多家公司。

我看到 plm 函数采用由单个时间指定的面板。也就是说,每个人都在不同的时间间隔内被观察到。现在我如何使用 plm 包运行:1.)公司固定效应 2.)公司和城市固定效应 3.)公司、城市、季度固定效应。

你能分辨出来吗?我对时间部分有点困惑,想知道我是否也可以使用公司和城市固定效果?在运行公司和城市固定效应时,我的小组将每个公司城市在本季度重复 4 次,而每个城市可能有多个公司。

对于 3.) 我可以使用 plm 命令组合公司、城市,但在公式中明确控制季度(如因子(季度))?

只是想更清楚地了解扩展 plm 以估计固定效果,而不仅仅是使用时间维度。我已经看过小插图了,但并不完全清楚。所以任何信息都会很棒。

0 投票
0 回答
92 浏览

panel-data - 时间固定效果(错误消息)

我想在 R 中运行固定效应回归,为此我定义了以下公式:

time.aspects <- as.formula(y ~ x1 + x2 + x3 + t)
time.total <- plm(time.aspects, data=all, index=c("i","t"), model = "内”)

x1、x2 和 x3 是我的自变量。我还想添加一个时间因子 t 来说明时间固定效应。在这方面,t 代表单年 1 到 10(包含在我的数据文件中)。

但是,如果我想通过以下方式考虑稳健的标准错误:

coeftest( time.total , vcov.= vcovSCC( time.total , type = "HC3"))

发生以下错误: 1 - diaghat 中的错误:二元运算符的非数字参数。

有谁知道如何避免这个错误信息?

0 投票
1 回答
3737 浏览

r - 在 R 中计算 R 平方内、之间或整体 R 平方

我正在从 Stata 迁移到 R ( plm package) 以进行面板模型计量经济学。在 Stata 中,随机效应等面板模型通常报告内部、中间和整体 R 平方。

我发现随机效应模型中报告的 R 平方plm对应于 R 平方内。那么,有没有办法使用plm packagein R 来获得整体和 R 平方之间的关系?

请参阅与 R 和 Stata 相同的示例:

在Stata中:

至少在这种情况下,R (0.18062) 中报告的 R 平方与 Stata (0.1799) 中报告的 R-sq Within 相似。有什么方法可以在 R 中获得 Stata 报告的(0.1860)和总体(0.1830)之间的 R-sq?

0 投票
1 回答
1780 浏览

stata - stata中的Chow测试

我有两个面板回归:

我想测试是否 b1=b2、c1=c2 和 d1=d2 我在 Stata 估计后测试中找不到 Chow 测试。似乎必须手动计算。xtreg但是Chow测试的公式需要Residual SS,命令后不上报。我可以在 R-sq 之间或之内使用吗?

我也考虑过testparm命令,但它只考虑了最后一次估计的系数。在我的情况下,它们是 的系数b2, c2, d2。那么,也许有机会指定一个方程并比较来自不同回归的系数?

或者有没有我没有考虑过的其他选择?

0 投票
1 回答
372 浏览

merge - 如何根据两个数据集中不唯一的标识符合并数据集

当在 Stata 中两个数据集被合并时,基于一个变量在任何一个数据集中都不是唯一的,合并 x:x 似乎不是一个有用的工具。什么策略会产生预期的结果?

程式化的例子:

数据集1

数据集2

目标:

直觉:有些资产管理公司可以由多家银行持有,而有些银行也拥有多家资产管理公司。

0 投票
2 回答
257 浏览

r - PostgreSQL,R:将表的所有行相乘以创建面板数据(时间序列)

我有一张buildings有 320 万行的表。我需要将此表扩展到 11 个不同的时期,以将其作为(平衡的) Paneldata 处理。这意味着对于每个物体,都有 11 个不同的年份(从 2000 年到 2010 年)需要观察。这些时期应该被称为:

表定义

我想在R中使用这些数据进行回归分析。

ibase_id是一个数组gid。 是一个与's 到对象ibase_dist的距离相关的数组。gid两个数组的长度始终相同。

数组中的gid' 属于 的记录buildings,它们位于centroid对象中心周围 500m 的半径内,并且具有 pv=TRUE(这意味着 、distinstdateinstp&capacpvidNOT NULL

例子:

ibase_id: {3075528,409073,322311,226643,833798,322344,226609};

ibase_dist {290,293,398,494,411,381,384}

对于每个时期,仅应考虑阵列的条目,其年份在面板数据的观察时期之前。(上面的查询还不起作用,因为我需要先连接数组)现在,这两个数组保存了所有年份的信息。这就是为什么我认为应该将它们添加到每个时间段,以便在扩展到面板数据之后,我计算ibase每条记录(11x 3,200,000)。

我不需要用于回归分析的所有列。如果它会显着提高乘法的性能,我们可以坚持行(基本上省略几何列):

解决方法

我的基本想法是创建一个periods包含 11 个不同时期的第二个表,并将该表与该表相乘buildings。不知道如何实现这一点。不幸的是,我对 R 没有太多经验,也没有使用R 的数据库接口

使用由 Visual C++ build 1800、64 位和 R x64 3.2.1 编译的 PostgreSQL 9.5beta2

0 投票
1 回答
314 浏览

r - 在R中创建两个向量的所有组合?

我有一个根据日期、状态和产品代码索引价格的数据框。

但是,有些数据丢失了。我想要日期、状态和产品代码的每个可能组合的数据点。

(顺便说一下,我的日期向量是从 200601 到 201212 的整数。)

我想这样做的方法是,对于每个缺失的价格,在最近的日期为同一州的同一 UPC 取价格。

假设状态 1 中的产品 A 缺少 200803 的价格。我想创建一个算法来查找状态 1 中产品 A 的 200804 价格,然后是 200802,然后是 200805 等,直到它找到价格。如果该州根本没有该产品的价格,我只想要一个 NA。

有谁知道如何做到这一点?我想有一个包可以做到这一点。谢谢。

0 投票
1 回答
108 浏览

stata - 如果面板数据取值一次,则定义变量

我有一个面板数据集,由一个 id 变量和一个特定的字符串变量标识,每个时间段(每周)具有不同的值。并非每个 id 每周都会出现(新的可以出现,旧的可以消失)。

当此变量包含特定术语时,我创建了一个虚拟变量,但它仅捕获一周内的一次出现。我想要的是每个 id 都有一个特定的虚拟对象,指示该术语是否至少在一周的出现中包含在字符串变量中。因此,如果在第 34 周 id x 包含该术语,我希望在所有其他周内也有一个假人,显示“1”,因为该术语曾经包含在 id x

我尝试格式化为 anxtset并替换 via F.,但这并没有按预期工作。

0 投票
3 回答
4013 浏览

r - 在 R 中生成时间虚拟变量(面板数据)

我正在尝试在 R 中生成时间虚拟变量。我正在分析季度面板数据(1990q1-2013q3)。如何生成 2007q1-2009q1 期间的时间虚拟变量,即 2007q1 dummy=1...

数据如图所示。资产排名是 id 变量。

在此处输入图像描述

问候和感谢!