0 投票

11 回答

52938 浏览

python - 线性模型不支持将字符串转换为浮点数

我的线性模型中不断出现此错误：

不支持将字符串转换为浮点数

具体来说，错误在这一行：

如果有帮助，这里是堆栈跟踪：

该模型是改编自此处和此处的教程。教程代码确实可以运行，所以我的 TensorFlow 安装没有问题。

输入 CSV 是许多二进制分类列 ( yes/ no) 形式的数据。最初，我将每列中的数据表示为 0 和 1，但是当我将其更改为ys 和ns 时，我得到了同样的错误。

我该如何解决？

2016-10-21T23:27:26.880

0 投票

1 回答

1178 浏览

python - Python：没有自变量的双向固定效应来估计残差

拥有一个带有 index1：shops、index2：DateTime 和 column：LogPrice 的多索引数据框，我想通过估计固定效应模型的残差来从数据中取出 EntityEffects 和 TimeEffects。

y _it = 常数 + α _i + δ _t + ε _it

LogPrice = 常量 + EntityEffects + TimeEffects + 错误

我正在使用以下代码：

我收到此错误：

你能帮我解决这个问题吗，或者你知道解决方法吗？提前谢谢了。

python regression linearmodels

2017-04-25T13:16:28.210

0 投票

0 回答

69 浏览

r - 在 R 中的线性模型中进行微分后考虑不同的可变长度

与 R 斗争。

我的线性 lm() 模型包含通过 diff() 区分的变量和不区分的变量。由于差异，差异变量是一个较短的观察值。因此，lm() 给出了不同长度的错误信息。

我对这个错误的解决方案的想法是，以某种方式将变量定义为时间序列（无论如何它们都是，但 R 不知道），然后准确地告诉 lm-Model，使用哪些年份（年度数据）。

据我了解，在差分之后，时间序列失去了它的第一个观察结果，因此，当我使用 ts()-Funktion 时，我将在一年后为差分函数设置起始年份。

更具体：假设我导入了变量 x 和 y 然后我去

而 y 保持不变

然后将产生上述错误。

假设 x 和 y 都从 1900 年开始。然后 dx 从 1901 年开始，因此对于所有变量，lm 必须从 1901 年开始。如上所述，我的想法是明确地将两个变量设为时间序列

然后以某种方式告诉 lm() 从 1901 年开始。

这是处理这些问题的好方法吗？我将如何编码最后一步？非常感谢！

r time-series date-difference linearmodels

2017-05-23T13:16:06.237

0 投票

1 回答

207 浏览

python - 在 python 中的 SGDClassifier 中，概率总和始终为 1 (100%)

我根据我的训练数据集预测一些值并计算概率，将它们相加总是给我 1 或 100% 这是我的训练数据

这是我的测试数据

这是我尝试过的

为什么它给出 1% 或 100% 的概率，我应该更改哪个参数以使概率总和正确..请提前建议谢谢。

python scikit-learn svm text-classification linearmodels

2017-05-31T05:43:03.373

0 投票

1 回答

1833 浏览

python - 一阶差分估计器......在熊猫数据框中

我有一个如下所示的数据框，我想在其上计算不同列之间的第一个差异估计量。我找到了这个包，但不确定如何实现它......另外，是否允许使用协变量？我是 python 和统计的新手，所以任何帮助将不胜感激！

我找到的包：https ://bashtage.github.io/linearmodels/doc/panel/models.html#linearmodels.panel.model.FirstDifferenceOLS

如何格式化数据： https ://bashtage.github.io/linearmodels/doc/panel/examples/data-formats.html

我的数据（现在多索引）：

我的尝试：

结果是：

python pandas statistics linearmodels

2017-06-19T17:16:15.230

0 投票

1 回答

114 浏览

python - 在 keras 中构建简单线性模型时出现“数组不是 python 函数”错误

我正在尝试使用keras以下方法构建一个简单的线性模型：

但我不断收到以下错误：

如何解决这个问题？

python keras linearmodels

2017-08-02T14:57:26.040

0 投票

1 回答

5070 浏览

python - 解释 GridSearchCV 中的岭回归

为什么即使我尝试了从 0.01 到 25 的一长串 alpha，我的交叉验证岭回归模型中的错误也没有显着变化？

代码

python scikit-learn linearmodels

2017-08-24T08:59:48.850

0 投票

2 回答

2010 浏览

python - 线性模型面板OLS：带星的回归输出

我正在使用 linearmodels 包来估计 Panel-OLS。作为示例，请参阅：

我想将回归的输出导出到 .tex 文件中。是否有一种方便的方法可以使用置信度星来格式化输出，而无需诸如 CI 之类的其他信息？该问题已在此处的标准 OLS 上下文中提出，但这不适用于“PanelEffectsResults”对象，因为我收到以下错误：

提前致谢。

python python-3.x regression panel-data linearmodels

2017-09-18T12:42:19.373

0 投票

1 回答

456 浏览

r - 关于物种丰度和性状数据的函数 manyglm()

我正在尝试使用以下代码运行 glm 分析：

我目前收到以下错误消息：

[[<-.data.frame( , i, value = c( 54L *tmp*, 54L, 54L, 54L, 54L, : 替换有 60326 行，数据有 8618

作为第一步，我根据以下内容为丰度数据创建了一个物种 x 绘图矩阵：

输出：class(AbundMat)=matrix, typeof(AbundMat)=integer, storage.mode(AbundMat)=integer, length(AbundMat)=8618, attributes(AbundMat)= 139(plots) 62(species)

然后我导入文件：

1）特征：具有62obs的data.frame。和 7 个变量（包括因子和数量）；包括；typeof(Traits)=list 和 class(Traits)=df

2）处理：具有139obs的data.frame。和 2 个变量（$plot 和 $site 作为因子）；typeof(Treatment)=list and class(Treatment)=df

然后，我按照本文附录中描述的示例对丰度数据进行矢量化：CATS 回归 - 一种基于模型的方法来研究基于特征的社区组装 ( http://onlinelibrary.wiley.com/store/10.1111/2041-210X .12280/asset/supinfo/mee312280-sup-0003-AppendixS3.pdf?v=1&s=0037b03799e63903d896ba208fb2a6cc1b5605d0）：

最后，我执行一个 glm（需要包 mvabund）：

这个阶段我收到上面提到的错误信息： Error in [[<-.data.frame( *tmp*, i, value = c(54L, 54L, 54L, 54L, 54L, : replacement has 60326 rows, data has 8618

请注意 8618*7=60326 （我有 7 个特征变量）

当我将我的数据文件与 CATS 回归论文中描述的丰度示例数据文件进行比较时，我注意到示例数据文件具有以下 str() 输出：

str(GrazedPlants$abundMat) num [1:32, 1:68] 0 210 195 1 617 0 1 75 1 0 ... - attr( , "dimnames")=List of 2 ..$ : chr [1:32 [ _ 1:83] “ALYSALYS” “ANTHVULN” “APHYMONS” “ARENSERP” ...

→ typeof = 双，类 = 矩阵

当我对我的数据运行 str() 时，我得到：

str(AbundMat) int [1:139, 1:62] 0 0 0 0 0 0 0 0 0 1 ... - attr(*, "dimnames")=List of 2 ..$ : chr [1:139] “A01” “A02” “A03” “A04” ... ..$ : 字符 [1:62] “sp01” “sp02” “sp03” “sp04” ...

→ typeof = 整数，类 = 矩阵

我的处理和特征数据的格式似乎与示例数据集的格式相匹配，只是我的大多数特征都是因子（而在示例中它们都是数字的）。

所以，我想知道错误消息是否是由于 'AbundMat' 不是所需的 class=double 形式（而是整数）？

此外，根据 str() 输出，“AbundMat”中似乎缺少属性（级别）。

是否可以将矩阵生成为 double 类型（类似于示例数据矩阵）？

============ 附加说明：==========================

作为附加说明，此代码可用于强制数据与函数 manyglm() 一起使用。它仅使用一行数据（单个图）。我想知道如何为多个站点调整此代码，即我的数据集中的 139 个图？

==================================================== ==

非常感谢您的任何建议。

这些是我的数据集：

1）物种x地块丰度（计数）数据（文件名：Abund）

2）物种x性状数据（文件名：Traits）

3）治疗数据（文件名：Treatment）

此外，这些是“grazedPlants.RData”文件的子集：

输入（头部（grazedPlants$aundMat））

输入（头部（grazedPlants$traits））

输入（头（放牧植物$治疗））

r matrix glm typeof linearmodels

2017-09-26T02:12:32.600

0 投票

2 回答

4609 浏览

python - ValueError：exog 没有完整的列排名

我正在PanelOLS从linearmodels包中运行一个。

就像经常发生的情况一样，缺少一些观察结果。当我在中运行等效命令时R（我认为等效命令是plm），我得到以下信息：

所以面板是不平衡的：一些人只有 17 个时间段的完整数据，而其他人则更多。但回归仍然存在。

等效的python命令是：

这给了我一个警告：

输入包含缺失值。删除缺少观察的行。

还有一个错误：

我该如何进行回归？

python linearmodels

2017-10-16T16:15:09.637

问题标签 [linearmodels]

代码

============ 附加说明：==========================

==================================================== ==

Reference