问题标签 [panel-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
mysql - 计算mysql中面板数据的时间差
我有一个看起来像这样的表(称为“会话”):
我想使用 mysql 来计算每个用户在每个活动上花费的秒数(“持续时间”),这是给定一天给定 user_id 的日期时间之间的差异,得到:
我可以使它适用于系列,但不适用于面板。谢谢!
r - 运行固定效应 plm R - 城市、年份、季度数据
我正在尝试使用 plm 包在 R 中使用固定效果来估计模型。我的数据如下所示,它是公司、城市、年份、季度级别。我按年按公司和城市级别观察销售和收入中的每一个。我的回归是收入~销售额。这是按收入计算的销售额,但希望控制公司和城市特定的不可观察数据。我的实际数据集中有 1000 多家公司。
我看到 plm 函数采用由单个时间指定的面板。也就是说,每个人都在不同的时间间隔内被观察到。现在我如何使用 plm 包运行:1.)公司固定效应 2.)公司和城市固定效应 3.)公司、城市、季度固定效应。
你能分辨出来吗?我对时间部分有点困惑,想知道我是否也可以使用公司和城市固定效果?在运行公司和城市固定效应时,我的小组将每个公司城市在本季度重复 4 次,而每个城市可能有多个公司。
对于 3.) 我可以使用 plm 命令组合公司、城市,但在公式中明确控制季度(如因子(季度))?
只是想更清楚地了解扩展 plm 以估计固定效果,而不仅仅是使用时间维度。我已经看过小插图了,但并不完全清楚。所以任何信息都会很棒。
panel-data - 时间固定效果(错误消息)
我想在 R 中运行固定效应回归,为此我定义了以下公式:
time.aspects <- as.formula(y ~ x1 + x2 + x3 + t)
time.total <- plm(time.aspects, data=all, index=c("i","t"), model = "内”)
x1、x2 和 x3 是我的自变量。我还想添加一个时间因子 t 来说明时间固定效应。在这方面,t 代表单年 1 到 10(包含在我的数据文件中)。
但是,如果我想通过以下方式考虑稳健的标准错误:
coeftest( time.total , vcov.= vcovSCC( time.total , type = "HC3"))
发生以下错误: 1 - diaghat 中的错误:二元运算符的非数字参数。
有谁知道如何避免这个错误信息?
r - 在 R 中计算 R 平方内、之间或整体 R 平方
我正在从 Stata 迁移到 R ( plm package
) 以进行面板模型计量经济学。在 Stata 中,随机效应等面板模型通常报告内部、中间和整体 R 平方。
我发现随机效应模型中报告的 R 平方plm
对应于 R 平方内。那么,有没有办法使用plm package
in R 来获得整体和 R 平方之间的关系?
请参阅与 R 和 Stata 相同的示例:
在Stata中:
至少在这种情况下,R (0.18062) 中报告的 R 平方与 Stata (0.1799) 中报告的 R-sq Within 相似。有什么方法可以在 R 中获得 Stata 报告的(0.1860)和总体(0.1830)之间的 R-sq?
stata - stata中的Chow测试
我有两个面板回归:
我想测试是否 b1=b2、c1=c2 和 d1=d2 我在 Stata 估计后测试中找不到 Chow 测试。似乎必须手动计算。xtreg
但是Chow测试的公式需要Residual SS,命令后不上报。我可以在 R-sq 之间或之内使用吗?
我也考虑过testparm
命令,但它只考虑了最后一次估计的系数。在我的情况下,它们是 的系数b2, c2, d2
。那么,也许有机会指定一个方程并比较来自不同回归的系数?
或者有没有我没有考虑过的其他选择?
merge - 如何根据两个数据集中不唯一的标识符合并数据集
当在 Stata 中两个数据集被合并时,基于一个变量在任何一个数据集中都不是唯一的,合并 x:x 似乎不是一个有用的工具。什么策略会产生预期的结果?
程式化的例子:
数据集1
数据集2
目标:
直觉:有些资产管理公司可以由多家银行持有,而有些银行也拥有多家资产管理公司。
r - PostgreSQL,R:将表的所有行相乘以创建面板数据(时间序列)
我有一张buildings
有 320 万行的表。我需要将此表扩展到 11 个不同的时期,以将其作为(平衡的) Paneldata 处理。这意味着对于每个物体,都有 11 个不同的年份(从 2000 年到 2010 年)需要观察。这些时期应该被称为:
表定义
我想在R中使用这些数据进行回归分析。
ibase_id
是一个数组gid
。
是一个与's 到对象ibase_dist
的距离相关的数组。gid
两个数组的长度始终相同。
数组中的gid
' 属于 的记录buildings
,它们位于centroid
对象中心周围 500m 的半径内,并且具有 pv=TRUE(这意味着 、dist
、instdate
、instp
&capac
是pvid
)NOT NULL
。
例子:
ibase_id: {3075528,409073,322311,226643,833798,322344,226609}
;
ibase_dist {290,293,398,494,411,381,384}
对于每个时期,仅应考虑阵列的条目,其年份在面板数据的观察时期之前。(上面的查询还不起作用,因为我需要先连接数组)现在,这两个数组保存了所有年份的信息。这就是为什么我认为应该将它们添加到每个时间段,以便在扩展到面板数据之后,我计算ibase
每条记录(11x 3,200,000)。
我不需要用于回归分析的所有列。如果它会显着提高乘法的性能,我们可以坚持行(基本上省略几何列):
解决方法
我的基本想法是创建一个periods
包含 11 个不同时期的第二个表,并将该表与该表相乘buildings
。不知道如何实现这一点。不幸的是,我对 R 没有太多经验,也没有使用R 的数据库接口。
使用由 Visual C++ build 1800、64 位和 R x64 3.2.1 编译的 PostgreSQL 9.5beta2
r - 在R中创建两个向量的所有组合?
我有一个根据日期、状态和产品代码索引价格的数据框。
但是,有些数据丢失了。我想要日期、状态和产品代码的每个可能组合的数据点。
(顺便说一下,我的日期向量是从 200601 到 201212 的整数。)
我想这样做的方法是,对于每个缺失的价格,在最近的日期为同一州的同一 UPC 取价格。
假设状态 1 中的产品 A 缺少 200803 的价格。我想创建一个算法来查找状态 1 中产品 A 的 200804 价格,然后是 200802,然后是 200805 等,直到它找到价格。如果该州根本没有该产品的价格,我只想要一个 NA。
有谁知道如何做到这一点?我想有一个包可以做到这一点。谢谢。
stata - 如果面板数据取值一次,则定义变量
我有一个面板数据集,由一个 id 变量和一个特定的字符串变量标识,每个时间段(每周)具有不同的值。并非每个 id 每周都会出现(新的可以出现,旧的可以消失)。
当此变量包含特定术语时,我创建了一个虚拟变量,但它仅捕获一周内的一次出现。我想要的是每个 id 都有一个特定的虚拟对象,指示该术语是否至少在一周的出现中包含在字符串变量中。因此,如果在第 34 周 id x 包含该术语,我希望在所有其他周内也有一个假人,显示“1”,因为该术语曾经包含在 id x
我尝试格式化为 anxtset
并替换 via F.
,但这并没有按预期工作。