问题标签 [linearmodels]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python:没有自变量的双向固定效应来估计残差
拥有一个带有 index1:shops、index2:DateTime 和 column:LogPrice 的多索引数据框,我想通过估计固定效应模型的残差来从数据中取出 EntityEffects 和 TimeEffects。
y it = 常数 + α i + δ t + ε it
LogPrice = 常量 + EntityEffects + TimeEffects + 错误
我正在使用以下代码:
我收到此错误:
你能帮我解决这个问题吗,或者你知道解决方法吗?提前谢谢了。
r - 在 R 中的线性模型中进行微分后考虑不同的可变长度
与 R 斗争。
我的线性 lm() 模型包含通过 diff() 区分的变量和不区分的变量。由于差异,差异变量是一个较短的观察值。因此,lm() 给出了不同长度的错误信息。
我对这个错误的解决方案的想法是,以某种方式将变量定义为时间序列(无论如何它们都是,但 R 不知道),然后准确地告诉 lm-Model,使用哪些年份(年度数据)。
据我了解,在差分之后,时间序列失去了它的第一个观察结果,因此,当我使用 ts()-Funktion 时,我将在一年后为差分函数设置起始年份。
更具体:假设我导入了变量 x 和 y 然后我去
而 y 保持不变
然后将产生上述错误。
假设 x 和 y 都从 1900 年开始。然后 dx 从 1901 年开始,因此对于所有变量,lm 必须从 1901 年开始。如上所述,我的想法是明确地将两个变量设为时间序列
然后以某种方式告诉 lm() 从 1901 年开始。
这是处理这些问题的好方法吗?我将如何编码最后一步?非常感谢!
python - 在 python 中的 SGDClassifier 中,概率总和始终为 1 (100%)
我根据我的训练数据集预测一些值并计算概率,将它们相加总是给我 1 或 100% 这是我的训练数据
这是我的测试数据
这是我尝试过的
为什么它给出 1% 或 100% 的概率,我应该更改哪个参数以使概率总和正确..请提前建议谢谢。
python - 一阶差分估计器......在熊猫数据框中
我有一个如下所示的数据框,我想在其上计算不同列之间的第一个差异估计量。我找到了这个包,但不确定如何实现它......另外,是否允许使用协变量?我是 python 和统计的新手,所以任何帮助将不胜感激!
如何格式化数据: https ://bashtage.github.io/linearmodels/doc/panel/examples/data-formats.html
我的数据(现在多索引):
我的尝试:
结果是:
python - 在 keras 中构建简单线性模型时出现“数组不是 python 函数”错误
我正在尝试使用keras
以下方法构建一个简单的线性模型:
但我不断收到以下错误:
如何解决这个问题?
python - 线性模型面板OLS:带星的回归输出
我正在使用 linearmodels 包来估计 Panel-OLS。作为示例,请参阅:
我想将回归的输出导出到 .tex 文件中。是否有一种方便的方法可以使用置信度星来格式化输出,而无需诸如 CI 之类的其他信息?该问题已在此处的标准 OLS 上下文中提出,但这不适用于“PanelEffectsResults”对象,因为我收到以下错误:
提前致谢。
r - 关于物种丰度和性状数据的函数 manyglm()
我正在尝试使用以下代码运行 glm 分析:
我目前收到以下错误消息:
[[<-.data.frame
( , i, value = c( 54L *tmp*
, 54L, 54L, 54L, 54L, : 替换有 60326 行,数据有 8618
作为第一步,我根据以下内容为丰度数据创建了一个物种 x 绘图矩阵:
输出:class(AbundMat)=matrix, typeof(AbundMat)=integer, storage.mode(AbundMat)=integer, length(AbundMat)=8618, attributes(AbundMat)= 139(plots) 62(species)
然后我导入文件:
1)特征:具有62obs的data.frame。和 7 个变量(包括因子和数量);包括;typeof(Traits)=list 和 class(Traits)=df
2)处理:具有139obs的data.frame。和 2 个变量($plot 和 $site 作为因子);typeof(Treatment)=list and class(Treatment)=df
然后,我按照本文附录中描述的示例对丰度数据进行矢量化:CATS 回归 - 一种基于模型的方法来研究基于特征的社区组装 ( http://onlinelibrary.wiley.com/store/10.1111/2041-210X .12280/asset/supinfo/mee312280-sup-0003-AppendixS3.pdf?v=1&s=0037b03799e63903d896ba208fb2a6cc1b5605d0):
最后,我执行一个 glm(需要包 mvabund):
这个阶段我收到上面提到的错误信息:
Error in [[<-.data.frame
( *tmp*
, i, value = c(54L, 54L, 54L, 54L, 54L, : replacement has 60326 rows, data has 8618
请注意 8618*7=60326 (我有 7 个特征变量)
当我将我的数据文件与 CATS 回归论文中描述的丰度示例数据文件进行比较时,我注意到示例数据文件具有以下 str() 输出:
str(GrazedPlants$abundMat) num [1:32, 1:68] 0 210 195 1 617 0 1 75 1 0 ... - attr( , "dimnames")=List of 2 ..$ : chr [1:32 [ _ 1:83] “ALYSALYS” “ANTHVULN” “APHYMONS” “ARENSERP” ...
→ typeof = 双,类 = 矩阵
当我对我的数据运行 str() 时,我得到:
str(AbundMat) int [1:139, 1:62] 0 0 0 0 0 0 0 0 0 1 ... - attr(*, "dimnames")=List of 2 ..$ : chr [1:139] “A01” “A02” “A03” “A04” ... ..$ : 字符 [1:62] “sp01” “sp02” “sp03” “sp04” ...
→ typeof = 整数,类 = 矩阵
我的处理和特征数据的格式似乎与示例数据集的格式相匹配,只是我的大多数特征都是因子(而在示例中它们都是数字的)。
所以,我想知道错误消息是否是由于 'AbundMat' 不是所需的 class=double 形式(而是整数)?
此外,根据 str() 输出,“AbundMat”中似乎缺少属性(级别)。
是否可以将矩阵生成为 double 类型(类似于示例数据矩阵)?
============ 附加说明:==========================
作为附加说明,此代码可用于强制数据与函数 manyglm() 一起使用。它仅使用一行数据(单个图)。我想知道如何为多个站点调整此代码,即我的数据集中的 139 个图?
==================================================== ==
非常感谢您的任何建议。
这些是我的数据集:
1)物种x地块丰度(计数)数据(文件名:Abund)
2)物种x性状数据(文件名:Traits)
3)治疗数据(文件名:Treatment)
此外,这些是“grazedPlants.RData”文件的子集:
输入(头部(grazedPlants$aundMat))
输入(头部(grazedPlants$traits))
输入(头(放牧植物$治疗))
python - ValueError:exog 没有完整的列排名
我正在PanelOLS
从linearmodels包中运行一个。
就像经常发生的情况一样,缺少一些观察结果。当我在中运行等效命令时R
(我认为等效命令是plm
),我得到以下信息:
所以面板是不平衡的:一些人只有 17 个时间段的完整数据,而其他人则更多。但回归仍然存在。
等效的python命令是:
这给了我一个警告:
输入包含缺失值。删除缺少观察的行。
还有一个错误:
我该如何进行回归?