问题标签 [linearmodels]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
11 回答
52938 浏览

python - 线性模型不支持将字符串转换为浮点数

我的线性模型中不断出现此错误:

不支持将字符串转换为浮点数

具体来说,错误在这一行:

如果有帮助,这里是堆栈跟踪:

该模型是改编自此处此处的教程。教程代码确实可以运行,所以我的 TensorFlow 安装没有问题。

输入 CSV 是许多二进制分类列 ( yes/ no) 形式的数据。最初,我将每列中的数据表示为 0 和 1,但是当我将其更改为ys 和ns 时,我得到了同样的错误。

我该如何解决?

0 投票
1 回答
1178 浏览

python - Python:没有自变量的双向固定效应来估计残差

拥有一个带有 index1:shops、index2:DateTime 和 column:LogPrice 的多索引数据框,我想通过估计固定效应模型的残差来从数据中取出 EntityEffects 和 TimeEffects。

y it = 常数 + α i + δ t + ε it

LogPrice = 常量 + EntityEffects + TimeEffects + 错误

我正在使用以下代码:

我收到此错误:

你能帮我解决这个问题吗,或者你知道解决方法吗?提前谢谢了。

0 投票
0 回答
69 浏览

r - 在 R 中的线性模型中进行微分后考虑不同的可变长度

与 R 斗争。

我的线性 lm() 模型包含通过 diff() 区分的变量和不区分的变量。由于差异,差异变量是一个较短的观察值。因此,lm() 给出了不同长度的错误信息。

我对这个错误的解决方案的想法是,以某种方式将变量定义为时间序列(无论如何它们都是,但 R 不知道),然后准确地告诉 lm-Model,使用哪些年份(年度数据)。

据我了解,在差分之后,时间序列失去了它的第一个观察结果,因此,当我使用 ts()-Funktion 时,我将在一年后为差分函数设置起始年份。

更具体:假设我导入了变量 x 和 y 然后我去

而 y 保持不变

然后将产生上述错误。

假设 x 和 y 都从 1900 年开始。然后 dx 从 1901 年开始,因此对于所有变量,lm 必须从 1901 年开始。如上所述,我的想法是明确地将两个变量设为时间序列

然后以某种方式告诉 lm() 从 1901 年开始。

这是处理这些问题的好方法吗?我将如何编码最后一步?非常感谢!

0 投票
1 回答
207 浏览

python - 在 python 中的 SGDClassifier 中,概率总和始终为 1 (100%)

我根据我的训练数据集预测一些值并计算概率,将它们相加总是给我 1 或 100% 这是我的训练数据

这是我的测试数据

这是我尝试过的

为什么它给出 1% 或 100% 的概率,我应该更改哪个参数以使概率总和正确..请提前建议谢谢。

0 投票
1 回答
1833 浏览

python - 一阶差分估计器......在熊猫数据框中

我有一个如下所示的数据框,我想在其上计算不同列之间的第一个差异估计量。我找到了这个包,但不确定如何实现它......另外,是否允许使用协变量?我是 python 和统计的新手,所以任何帮助将不胜感激!

我找到的包:https ://bashtage.github.io/linearmodels/doc/panel/models.html#linearmodels.panel.model.FirstDifferenceOLS

如何格式化数据: https ://bashtage.github.io/linearmodels/doc/panel/examples/data-formats.html

我的数据(现在多索引):

我的尝试:

结果是:

0 投票
1 回答
114 浏览

python - 在 keras 中构建简单线性模型时出现“数组不是 python 函数”错误

我正在尝试使用keras以下方法构建一个简单的线性模型:

但我不断收到以下错误:

如何解决这个问题?

0 投票
1 回答
5070 浏览

python - 解释 GridSearchCV 中的岭回归

为什么即使我尝试了从 0.01 到 25 的一长串 alpha,我的交叉验证岭回归模型中的错误也没有显着变化?

代码

clf.cv_results_

0 投票
2 回答
2010 浏览

python - 线性模型面板OLS:带星的回归输出

我正在使用 linearmodels 包来估计 Panel-OLS。作为示例,请参阅:

我想将回归的输出导出到 .tex 文件中。是否有一种方便的方法可以使用置信度星来格式化输出,而无需诸如 CI 之类的其他信息?该问题已在此处的标准 OLS 上下文中提出,但这不适用于“PanelEffectsResults”对象,因为我收到以下错误:

提前致谢。

0 投票
1 回答
456 浏览

r - 关于物种丰度和性状数据的函数 manyglm()

我正在尝试使用以下代码运行 glm 分析:

我目前收到以下错误消息:

[[<-.data.frame( , i, value = c( 54L *tmp*, 54L, 54L, 54L, 54L, : 替换有 60326 行,数据有 8618

作为第一步,我根据以下内容为丰度数据创建了一个物种 x 绘图矩阵:

输出:class(AbundMat)=matrix, typeof(AbundMat)=integer, storage.mode(AbundMat)=integer, length(AbundMat)=8618, attributes(AbundMat)= 139(plots) 62(species)

然后我导入文件:

1)特征:具有62obs的data.frame。和 7 个变量(包括因子和数量);包括;typeof(Traits)=list 和 class(Traits)=df

2)处理:具有139obs的data.frame。和 2 个变量($plot 和 $site 作为因子);typeof(Treatment)=list and class(Treatment)=df

然后,我按照本文附录中描述的示例对丰度数据进行矢量化:CATS 回归 - 一种基于模型的方法来研究基于特征的社区组装 ( http://onlinelibrary.wiley.com/store/10.1111/2041-210X .12280/asset/supinfo/mee312280-sup-0003-AppendixS3.pdf?v=1&s=0037b03799e63903d896ba208fb2a6cc1b5605d0):

最后,我执行一个 glm(需要包 mvabund):

这个阶段我收到上面提到的错误信息: Error in [[<-.data.frame( *tmp*, i, value = c(54L, 54L, 54L, 54L, 54L, : replacement has 60326 rows, data has 8618

请注意 8618*7=60326 (我有 7 个特征变量)

当我将我的数据文件与 CATS 回归论文中描述的丰度示例数据文件进行比较时,我注意到示例数据文件具有以下 str() 输出:

str(GrazedPlants$abundMat) num [1:32, 1:68] 0 210 195 1 617 0 1 75 1 0 ... - attr( , "dimnames")=List of 2 ..$ : chr [1:32 [ _ 1:83] “ALYSALYS” “ANTHVULN” “APHYMONS” “ARENSERP” ...

→ typeof = 双,类 = 矩阵

当我对我的数据运行 str() 时,我得到:

str(AbundMat) int [1:139, 1:62] 0 0 0 0 0 0 0 0 0 1 ... - attr(*, "dimnames")=List of 2 ..$ : chr [1:139] “A01” “A02” “A03” “A04” ... ..$ : 字符 [1:62] “sp01” “sp02” “sp03” “sp04” ...

→ typeof = 整数,类 = 矩阵

我的处理和特征数据的格式似乎与示例数据集的格式相匹配,只是我的大多数特征都是因子(而在示例中它们都是数字的)。

所以,我想知道错误消息是否是由于 'AbundMat' 不是所需的 class=double 形式(而是整数)?

此外,根据 str() 输出,“AbundMat”中似乎缺少属性(级别)。

是否可以将矩阵生成为 double 类型(类似于示例数据矩阵)?

============ 附加说明:==========================

作为附加说明,此代码可用于强制数据与函数 manyglm() 一起使用。它仅使用一行数据(单个图)。我想知道如何为多个站点调整此代码,即我的数据集中的 139 个图?

==================================================== ==

非常感谢您的任何建议。

这些是我的数据集:

1)物种x地块丰度(计数)数据(文件名:Abund)

2)物种x性状数据(文件名:Traits)

3)治疗数据(文件名:Treatment)

此外,这些是“grazedPlants.RData”文件的子集:

输入(头部(grazedPlants$aundMat))

输入(头部(grazedPlants$traits))

输入(头(放牧植物$治疗))

0 投票
2 回答
4609 浏览

python - ValueError:exog 没有完整的列排名

我正在PanelOLSlinearmodels包中运行一个。

就像经常发生的情况一样,缺少一些观察结果。当我在中运行等效命令时R(我认为等效命令是plm),我得到以下信息:

所以面板是不平衡的:一些人只有 17 个时间段的完整数据,而其他人则更多。但回归仍然存在。

等效的python命令是:

这给了我一个警告:

输入包含缺失值。删除缺少观察的行。

还有一个错误:

我该如何进行回归?