“patsy”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

7970 浏览

python - 具有分类变量的 statsmodels 中的聚类标准错误（Python）

我想在使用分类变量和聚集标准错误的 statsmodels 中运行回归。

我有一个包含机构、治疗、年份和注册列的数据集。治疗是一个假人，机构是一个字符串，其他都是数字。我确保删除任何空值。

我得到以下信息：

ValueError：权重和列表的长度不同。

有没有办法解决这个问题，所以我的标准错误集群？

2019-01-24T14:58:24.303

0 投票

2 回答

78 浏览

python - Statsmodels中OLS的预测结果如何识别主体？

我正在 Jupyter 笔记本中使用 Statsmodels 进行线性回归。数据位于名为“train_base”的 DataFrame 中，其中 id 列标识了我的数据库的每个唯一主题。train_base 是这样的：

主要代码块如下所示。请注意，我正在使用另一个名为“test_base”的基础进行预测，并且该基础也具有与“train_base”相同的结构，除了“y”列：

预测是这样的：

在我看来，预测中显示的第一列是原始 train_base 的索引（我正确吗？）。由于我需要确定我的测试库中每个人的预测值，我必须做什么才能在预测中包含“id”列？

python statsmodels patsy

2019-02-26T22:22:58.340

0 投票

3 回答

5672 浏览

python - PatsyError：错误评估因素：NameError：

我是 Python 编程的绝对新手，目前正在学习它的基本统计数据。

我面临着一个

“PatsyError：错误评估因素：NameError：”

在代码上pred = model.predict(pd.DataFrame(calo['wt'])

下面是我的代码：

这会引发一个错误：

需要您的帮助来解决这个问题。

提前致谢。:)

python macos statsmodels patsy

2019-03-19T16:55:32.637

0 投票

1 回答

147 浏览

python - 如何在python（patsy）中编写多元公式，VAR是否支持？

我想使用向量自回归 ( VAR) 进行多元数据分析，但想要更多的自由度。例如，我正在处理的问题可能如下所示：

所以你看，上面的方程不是一个简单的VAR(1)或VAR(2)模型，而是一个混合体。python的任何统计模型包是否支持这样的方程，以及如何用公式或patsy编写它？

python regression formula patsy

2019-04-21T20:31:21.723

0 投票

1 回答

277 浏览

python - 如何使用 pastey 创建 dmatrix 而不必单独写出每个变量名？

假设我有一个大数据框和一些列列表，我希望能够将它们放在一个 patsy dmatricies 中，而不必单独写出每个名称。也就是说，我想将列表中的名称称为列名列表以形成术语。而不是写出我的数据框列中的每一个术语。

例如采取以下df

据我了解，将其称为广告矩阵需要我执行以下操作：

y,x = dmatrices('a~b+c+d+e', data=df) 但是，我希望能够按照以下方式运行更多内容：

然而，这并不成功。

我还尝试使用包含两个条目的字典，例如回归和控制，其中填充了列名列表，然后将其输入到 dmatricies 的第一个条目中，但它也不起作用。

有没有人有任何建议可以更有效地让事情进入 patsy 的 dmatricies，而不是写出我们想要包含在矩阵中的每一个列名？

提前感谢，如果我不清楚任何事情，请告诉我。

python pandas statsmodels patsy

2019-04-28T02:37:01.340

0 投票

1 回答

189 浏览

python - patsy dmatrices 引发“AssertionError”

Noob 尝试我的第一个负二项式回归。谷歌 Colab 上的 iPython。我将数据集加载为 pandas df。下面公式中的特征（和目标）都出现在 df 中（我将其命名为“数据集”）。

我也带进来

然而，当我

我只是得到AssertionError:, 和一个指向第四行的箭头（开始“响应”的那个）。我不知道如何解决这个问题，也无法在这个网站上找到类似的问题 - 请提供任何明智的指导？

python google-colaboratory patsy

2019-06-11T14:37:15.533

0 投票

1 回答

92 浏览

python - 如何将列名列表转换为 patsy 公式字符串？

我有一个 pandas 列名列表（由所有虚拟变量组成），我想将其转换为公式字符串以复制和粘贴用于 statsmodels。

有没有办法以编程方式做到这一点？

示例代码

期望的输出：

python string list patsy

2019-08-27T17:11:24.390

0 投票

2 回答

44 浏览

python - 将一堆不同的项目移动到 python 列表的末尾

我有这个 python 列表：

['Intercept', 'a', 'country[T.BE]', 'country[T.CY]', 'country[T.DE]', 'b', 'c', 'd', 'e']

我想要最后的国家项目：

['Intercept', 'a', 'b', 'c', 'd', 'e', 'country[T.BE]', 'country[T.CY]', 'country[T.DE]']

如何做到这一点？

（注意，这些项目是我将用于回归分析的数据框的列标题。列名和奇怪的排序由 patsy.dmatrices 生成。）

我尝试了排序、弹出、删除和列表理解，但无济于事。在这种情况下，我决定不解释我做了什么来解决这个问题并且没有工作。这是一个简单的问题，与一位评论员不同，我没有几十年的编程经验。

python patsy

2019-08-28T23:53:26.910

0 投票

0 回答

65 浏览

python - 如何在 Python (patsy) 中正确使用新版本的包？已经安装了，但是继续使用旧版本

在我的 Python 3.7.2 上，我需要包 patsy 0.5.1
1. -pip install patsy (导致 0.5.1) 正在安装
2. 以下代码仍然显示 patsy 0.5.0 import patsy patsy.__version__
3. pip uninstall patsy 和 pip uninstall patsy==0.5.0 导致只有 0.5.1 被卸载

这是此软件包特有的问题吗？还是有一种普遍接受的安全方法来做到这一点？像这样的清理通常是必要的吗？

不建议手动删除任何 patsy 0.5.0 文件夹吗？

python installation version uninstallation patsy

2019-09-12T22:36:07.417

0 投票

0 回答

47 浏览

python - 在 pystatsmodels 中使用 Patsy 时如何从 bspline 获取原始系数

variable*coefficient我正在运行 GLM，并且必须将来自我们的 IT 部门的离散值移交给我们。

也就是说，我不确定如何使用bs()from 函数计算分段回归模型中的斜率patsy。

假设我有以下模型：

y ~ bs(length, degree = 1, knots = [32]

这给了我两行标准pystatsmodel参数（系数、pvalues、标准误差等）。

这些价值观是，

我也可以这样运行它： y ~ length + np.maximum(length-32,0)

哪个产量

我不明白的是，当我通过这两个模型运行测试集时，它们会产生相同的预测。

在这两种情况下，我都不确定 patsy 在后台做什么，我想知道，为了回答我的问题，我应该

长度的斜率 1 应该来自系数的指数，长度的斜率 2 是指数（系数 1 + ceoff2）。如果是这种情况，该规则是否适用于这两种语法？

python statsmodels patsy

2019-09-19T14:50:25.093

问题标签 [patsy]

Reference