问题标签 [patsy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Patsy 公式中的多个分类变量
我有一些数据,有多个分类元素。
我想使用回归对它们进行建模,为了方便起见,使用与 statsmodels 一起使用的 patsy 公式。
当仅使用一个分类变量时,如公式中所示'C(Weekday, Treatment) - 1'
,它按预期工作,删除截距并在每个类别的设计矩阵中留下一列。
但是,当使用 2 个不同的分类变量时,例如'C(Status, Treatment) + C(Weekday, Treatment) - 1'
,则结果矩阵确实没有截距,而且“工作日”的值之一也丢失了,好像我没有-1
'd。
是否有一些我没有看到的统计原因?去除截距不足以阻止完美的共线性吗?谢谢
python - TypeError:“DesignMatrix”对象不可调用
我正在尝试在 JupyterLab 的 ipynb 笔记本上使用 patsy 包创建 B 样条:
这在我第一次运行时工作正常。但是当我再次尝试重新运行此单元格时,它会失败并出现以下错误:
python - 如何在 patsy 矩阵上进行 sm.Logit 回归?
我想为 P(wage > 250) 的具有四个自由度的自然三次样条函数创建一个 Logit 图,但由于某种原因发生了错误。我不明白为什么,因为 OLS 工作正常。
这是代码(它应该可以完全工作而无需任何调整,当然,有问题的部分除外):
错误是:
我尝试转置数据框,但结果是一些乱码图。我该如何正确地做到这一点?
python - Patsy 和 Pandas 之间的标准化结果不同 - Python
我发现了一个有趣的问题,我很想听听你的解释。
如果您打印出标准化x2 列的结果,您会发现结果完全不同。结果如下:
Patsy_Standarlize_Output = [-1.21701061,-0.07791372,-0.66884723,2.23584028,0.69898536,-0.71843674,-0.00416815,-0.2484492]
Pandas_Standarlize_Output = [-1.13840918, -0.07288161, -0.62564929, 2.09143707, 0.65384094, -0.67203603, -0.00389895, -0.23240294]
我的问题是,既然我对同一列进行了标准化,为什么结果不同?
我期待听到您的精彩诠释!非常感谢您的时间和帮助!
python-3.x - 固定效应模型的 Patsy 等效项
我正在尝试使用以下 Python 代码在 Python 上创建一个固定效果模型 -
它的 patsy 等价物是什么?我们如何在 PanelOLS 上创建它?
python - 将 Patsy 用于 Logistic 回归模型的值错误
为了我的问题,我制作了一个非常简单的逻辑模型。这是下面的代码;
请原谅我蹩脚的代码,我正在匆忙写这个 - 需要去工作哈哈。这段代码抛出了一个值错误 - ValueError: shape (5,2) and (5,2) not aligned: 2 (dim 1) != 5 (dim 0) about line 18。
我真的不明白这些是如何不对齐的,因为我只是使用 predict() 将训练数据 X 传递回模型。我的感觉是我错过了关于 patsy.dmatrices 的一些东西。
有人有想法吗?
python - Patsy Dmatrices X, y 分裂
使用 patsy.dmatrices 将我的数据拆分为 y,x 并且我正在丢失观察结果。前任:
我df.shape
的长度约为 54,000,000,但是在 x/y 拆分之后,我的y.shape
和x.shape
正在记录大约 43,000,000 次观察。我检查了我的df.isna().sum()
,我全盘坐在 0 位。有人可以解释发生了什么,或者解决这个问题吗?我已经使用备用变量在同一个数据帧上执行了拆分,例如
并且尺寸没有问题。
python - 有没有办法在没有拦截(PyMC3)的情况下运行 GLM.from_formula ?
这可能是一个愚蠢的问题,但我搜索了 pyMC3 文档和论坛,似乎找不到答案。我正在尝试从我知道先验不应该有截距的数据集创建线性回归模型。目前我的实现如下所示:
正如我所说,我知道我不应该拦截,但我似乎无法找到一种方法来告诉 GLM.from_formula() 不要寻找一个。大家有解决办法吗?提前致谢!