问题标签 [linearmodels]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
162 浏览

python - 如何在具有线性模型的 IV2SLS 中按实体和年份进行聚类?

我正在研究非洲国家的面板模型,他们的民主得分、log(人均 gdp)有 3 个滞后,log(雨)量也有 3 个滞后。我试图通过 IV2SLS 找出由 log(rain)(及其滞后)引起的 log(人均 gdp)(及其滞后)的经济冲击。我还想按国家和年份进行聚类。

我的索引是“国家”,然后是“年份”。我的列名如下:

['democracy', 'log_gdp_per_cap', 'log_gdp_per_cap_lag1', 'log_gdp_per_cap_lag2', 'log_gdp_per_cap_lag3', 'lrain_mw_l', 'lrain_mw_l2', 'lrain_mw_l3', 'lrain_mw_l4']

"lrain_mw_l_"要清楚,这些列是日志(雨)和滞后。

数据集的样本图像; 最后的降雨滞后延伸到右侧

我目前编写的模型如下:

数据框:

模型本身:

它返回以下错误消息:

问题似乎出在索引中,但我不确定是什么。那么,任何人都可以就如何使用 IV2SLS 按实体和年份使用聚类标准错误提供建议吗?

编辑:

重置索引后,我尝试了以下操作:

它会返回一个答案,尽管我对此不太有信心。它是按“年份”和“国家”聚类的吗?它说它只是以一种方式聚集,我不确定是什么。如果我试图使用降雨变量作为 gdp 变量的工具,以查看 log(人均 gdp)变化对民主的影响,我这样做对吗?我也不确定是否使用了固定效果。

0 投票
1 回答
70 浏览

python - 我们如何解释随机梯度下降分类器的特征重要性?

我有一个用 scikit-learn 训练的 SGDClassifier 模型。我提取特征名称.get_feature_names()和系数.coef_

我将 2 列组合在一个数据框中,如下所示:

我想知道如何解释特征重要性?正的高值是什么意思?低负值是什么意思?

0 投票
0 回答
98 浏览

python - 如何在 python 线性模型中进行部分 F 测试?

我想在 python 线性模型中做部分 F 测试,

有什么命令我可以做到吗?

0 投票
0 回答
40 浏览

classification - 具有混杂效应的分类

假设一个特征空间X和一个二元变量Y都被另一个变量混淆了Z,有什么方法可以建立一个分类器,Y以便在分类中控制X混淆效果Z。除了以下内容,我找不到很多关于这个主题的讨论:

  1. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3117385/
  2. 具有逻辑链接的混合效应模型。
  3. 仅使用混杂因素为响应构建预测模型,并计算残差。对残差应用任何分类算法。我预计这会有偏差。

任何其他可以解释混杂效应的线性或非线性分类算法?

0 投票
2 回答
91 浏览

python - Pycharm Python 控制台回归输出未对齐

我对 Python 和 Pycharm 比较陌生,所以我不知道这是否是一个愚蠢的问题。突然我遇到了一个奇怪的问题:python 控制台中任何类型的回归的摘要输出都没有正确对齐,但是,如果我从终端运行脚本,它是完全对齐的。几天前它运行良好,但现在我遇到了linearmodelsstatsmodels的问题。如果你能帮助我,我会很高兴,因为它不容易阅读。

这是产生问题的代码示例。

接下来,截图。

Python 控制台 终端

0 投票
0 回答
129 浏览

python - 为什么 Python 中的 Panel OLS 在长度相同时会给我错误“依赖和 exog 必须具有相同数量的观察值”?

我正在尝试使用线性模型中的面板 OLS,但收到一条消息说内生变量和外生变量的长度不同。根据 PanelOLS 函数中的代码y.shape[0] != x.shape[0],但是当我打印两个形状时,它的长度相同。

两者xy都是使用这种格式的多索引 df:

我是否缺少某些特定于 Panel OLS 的东西?

y 变量是 UPT,x 是treatUberX 或treatGTNotStd

数据快照——还有城市和州,这两个字符串都无法在镜头中捕获:

数据框截图

0 投票
0 回答
35 浏览

r - 用于复杂线性混合模型的 R lme4 包

我试图将线性混合模型拟合到具有以下特殊特征的数据集:

有一个分类变量 A 取值 {1,2,...,K},它被认为是 {1,2} 的固定效应和 {3,...,K} 的随机效应。我应该如何在 R 中的lmer函数中实现它?

更具体地说,考虑最简单的模型y_i = b_0 + A + error

(一个接近的解决方案是分别为 {1,2} 和 {3,...,K} 估计两个模型,但这会影响对误差项方差的估计。)

0 投票
0 回答
31 浏览

r - 线性混合效应模型中的奇点

数据集描述:我使用了一个包含多个受试者的神经心理学 (np) 测试的数据集。每个受试者在他/她的后续行动中都会进行一次以上的测试,即每年进行一次测试。我研究这些科目的认知衰退。我拥有的信息是:个人编号(身份证号),教育(年),性别(M / F作为因素),年龄(年),基线时间(=第一次np测试后的年)。

目标:我的目标是衡量他们的 np 测试的变化率,即他们每个人每年的认知衰退。为此,我使用线性混合效应模型 (LMEM),考虑到上述参数,并计算每个受试者的斜率。

问题:当我运行可能的模型(每次组合不同的参数)时,我也会检查它们的奇异性,几乎所有情况下的结果都是 TRUE。所以我的模型呈现奇点!如果我想使用这些模型进行预测,这并不好,因为这意味着模型过度拟合数据。但是现在我只想找到每个人的斜率,我认为这不是问题,或者更好的是,我认为这是一个优势,因为在这种情况下,奇点为受试者的斜率提供了更精确的计算。你认为这个想法正确吗?

0 投票
0 回答
32 浏览

r - 在 R 中使用具有交互作用的模型添加预测

我正在使用建模器添加基于具有交互作用的线性回归模型的预测。问题是 add_predictions() 是否适用于交互?

从这个例子来看,它似乎有效。然而,问题是它总是有效吗?什么是三向交互?其他类型的模型(物流)呢?

0 投票
1 回答
401 浏览

python - 解释 Hausman 测试结果 Python(线性模型)

这是我的代码:

这是测试结果:

我这样做对吗?我对结果有何看法?