问题标签 [statsmodels]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

2459 问题

0 投票

2 回答

37930 浏览

python-2.7 - Python中的logit回归和奇异矩阵错误

我正在尝试对德国信用数据运行 logit 回归 (www4.stat.ncsu.edu/~boos/var.select/german.credit.html)。为了测试代码，我只使用了数值变量，并尝试使用以下代码对其结果进行回归。

当我检查数据时，所有 8.0 列似乎都是独立的。尽管如此，我得到了奇异矩阵错误。你能帮忙吗？

谢谢

2013-12-20T12:32:08.733

0 投票

2 回答

11582 浏览

python - 为什么 Python（scipy、statsmodels）中的 t-test 给出的结果与 R、Stata 或 Excel 不同？

（问题已解决；x,y 和 s1,s2 的大小不同）

在 R 中：

在 STATA 和 Excel 中获得相同的数字

无论我尝试哪种选项，我都无法使用 statsmodels.stats.weightstats.ttest_ind 或 scipy.stats.ttest_ind 复制相同的结果。

一定有成千上万的人使用 Python 计算 t-test。我们都得到不正确的结果吗？（我通常依赖 Python，但这次我用 STATA 检查了我的结果）。

python scipy statsmodels

2013-12-20T18:52:07.223

0 投票

1 回答

26202 浏览

python - Pandas Dataframe AttributeError：“DataFrame”对象没有属性“design_info”

我正在尝试使用OLS 实现的predict()功能。statsmodels.formula.api当我将新数据框传递给函数以获取样本外数据集的预测值时，result.predict(newdf)返回以下错误：'DataFrame' object has no attribute 'design_info'. 这是什么意思，我该如何解决？完整的追溯是：

编辑：这是一个可重现的例子。当我腌制然后取消腌制结果对象（我需要在我的实际项目中这样做）时，似乎会发生错误：

python pandas scipy pickle statsmodels

2013-12-22T00:18:54.157

0 投票

1 回答

2459 浏览

python - 如何将 Statsmodels 警告变成异常

Python 和 Panda 新手在这里。我正在尝试使用 statsmodels 来拟合逻辑回归来计算选民投票的概率。我在辖区一级工作；所以有时函数不收敛，我收到以下错误：警告：已超过最大迭代次数。

我已经将最大迭代次数增加到 1000 次。然后我试图将那个“警告”变成一个异常。我已导入警告并包含 warnings.simplefilter('error', Warning) 以尝试捕获它，但它似乎不是真正的 Python 警告。相反，它是 statsmodels 在达到最大迭代次数时打印出来的。

所以现在我想知道是否有办法说：

python warnings statsmodels convergence

2013-12-30T16:08:54.150

0 投票

1 回答

564 浏览

python - statsmodels 数据更新频率

考虑一个每小时观察的向量，数据每 12 小时更新一次。

用 R，我可以做到

ts(vector_with_R, 频率=12)

在 statsmodels 中，“频率”控制时间序列的单位，而不是“数据窗口”。如何更改“数据窗口”。

python pandas time-series statsmodels

2013-12-31T09:30:20.653

0 投票

0 回答

1565 浏览

python - 使用 statsmodels.nonparametric.kde 而不是 scipy.stats.gaussian_kde

我读过使用该statsmodels.nonparametric.kde模块而不是scipy.stats.gaussian_kde可以显着提高速度。

我有一个简单的代码块（4 行代码），我目前正在计算使用它，scipy.stats.gaussian_kde我想将它们替换为等效的statsmodels，看看我是否真的可以提高速度。

这是 MWE：

可以看出，只有 4 行代码需要替换。不幸的是，文档statsmodels.nonparametric.kde有点差，我不知道如何进行此类替换。

最后一行是最重要的，因为大部分计算时间都花在了这里（如此处所述加速内核估计采样）。

python scipy statsmodels

2014-01-07T17:39:56.090

0 投票

1 回答

686 浏览

sympy - 如何在 sympy 中优化对 hessian 的评估？

我正在使用statsmodels通用似然模型的库。由于我有一个相当复杂的似然函数，我曾经sympy为我计算梯度和粗麻布。这很好用，但对我的需要来说太慢了，因为似然函数包含 term b0*x0 + b1*x1 + ... + bn*xn。这样，粗麻布尺寸就会增加，N^2复杂性也会增加。

expensive_operation * x0hessian 的元素通常与和等非常相似expensive_operation * x1。这意味着如果我可以预先计算expensive_operation并在 hessian 的函数中使用它，我将大大提高性能。

所以问题是 - 有没有一种工具可以列出功能，优化它们，然后有效地评估它们？类似numexprwhich 会列出功能的东西？

sympy statsmodels numexpr

2014-01-18T20:26:18.330

0 投票

2 回答

9321 浏览

python - Statsmodels OLS function for multiple regression parameters

Lets say I want to find the alpha (a) values for an equation which has something like

Using OLS lets say we start with 10 values for the basic case of i=2

Using statsmodel I would generally the following code to obtain the roots of nx1 x and y array:

But this does not work when x is not equivalent to y. The equation is here on the first page if you do not know what OLS.

python numpy statistics statsmodels

2014-01-20T12:45:38.670

0 投票

1 回答

11853 浏览

python - 从 Pandas 回归中获取回归线

我已经尝试使用 (pandas)pd.ols 和 (statsmodels)sm.ols 来获得带有回归线的回归散点图，我可以得到散点图，但我似乎无法获得参数来获取要绘制的回归线。很明显，我在这里进行了一些剪切和粘贴编码:-(（以此为指导： http: //nbviewer.ipython.org/github/weecology/progbio/blob/master/ipynbs/statistics.ipynb

我的数据在 pandas DataFrame 中，x 列是 merge2[:-1].lastqu 和 y 数据列是 merge2[:-1].Units 我的代码现在如下：获取回归：

^^^^ 好像还可以

^^^^^ 这完成了散点图****并且下面没有给我回归线

数据框的片段： [:-1] 从数据中消除当前周期，该周期随后将成为投影

编辑：

我发现我可以这样做：

如Statsmodels 文档中所述，这似乎得到了我想要的主要内容（以及更多内容）我仍然想知道我在之前的代码中哪里出错了！

python matplotlib pandas statsmodels

2014-01-23T19:27:15.317

0 投票

2 回答

6788 浏览

python - Pandas Statsmodels ols 使用 DF 预测器进行回归预测？

使用 Pandas OLS，我能够拟合和使用如下模型：

我需要切换到 statsmodels 以获得一些额外的功能（主要是残差图见（问题在这里）

所以现在我有：

和：

但我无法得到

或任何变体给我一个预测？请注意，pd.ols 使用相同的 merge2.lastqu[-1:] 来获取我想要“预测”的数据，无论我在 () 中放入什么来预测我都没有任何乐趣。似乎statsmodels 想要 () 中的特定内容，而不是 pandas DF 单元格我什至试图在其中放置一个数字，例如 2696，但仍然没有......我目前的错误是

python pandas statsmodels

2014-01-23T21:03:56.163

1 2 3 4 5 6 7 8 9 10

问题标签 [statsmodels]

Reference