问题标签 [statsmodels]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
37930 浏览

python-2.7 - Python中的logit回归和奇异矩阵错误

我正在尝试对德国信用数据运行 logit 回归 (www4.stat.ncsu.edu/~boos/var.select/german.credit.html)。为了测试代码,我只使用了数值变量,并尝试使用以下代码对其结果进行回归。


当我检查数据时,所有 8.0 列似乎都是独立的。尽管如此,我得到了奇异矩阵错误。你能帮忙吗?

谢谢

0 投票
2 回答
11582 浏览

python - 为什么 Python(scipy、statsmodels)中的 t-test 给出的结果与 R、Stata 或 Excel 不同?

(问题已解决;x,y 和 s1,s2 的大小不同)

在 R 中:

在 STATA 和 Excel 中获得相同的数字

无论我尝试哪种选项,我都无法使用 statsmodels.stats.weightstats.ttest_ind 或 scipy.stats.ttest_ind 复制相同的结果。

一定有成千上万的人使用 Python 计算 t-test。我们都得到不正确的结果吗?(我通常依赖 Python,但这次我用 STATA 检查了我的结果)。

0 投票
1 回答
26202 浏览

python - Pandas Dataframe AttributeError:“DataFrame”对象没有属性“design_info”

我正在尝试使用OLS 实现的predict()功能。statsmodels.formula.api当我将新数据框传递给函数以获取样本外数据集的预测值时,result.predict(newdf)返回以下错误:'DataFrame' object has no attribute 'design_info'. 这是什么意思,我该如何解决?完整的追溯是:

编辑:这是一个可重现的例子。当我腌制然后取消腌制结果对象(我需要在我的实际项目中这样做)时,似乎会发生错误:

0 投票
1 回答
2459 浏览

python - 如何将 Statsmodels 警告变成异常

Python 和 Panda 新手在这里。我正在尝试使用 statsmodels 来拟合逻辑回归来计算选民投票的概率。我在辖区一级工作;所以有时函数不收敛,我收到以下错误:警告:已超过最大迭代次数。

我已经将最大迭代次数增加到 1000 次。然后我试图将那个“警告”变成一个异常。我已导入警告并包含 warnings.simplefilter('error', Warning) 以尝试捕获它,但它似乎不是真正的 Python 警告。相反,它是 statsmodels 在达到最大迭代次数时打印出来的。

所以现在我想知道是否有办法说:

0 投票
1 回答
564 浏览

python - statsmodels 数据更新频率

考虑一个每小时观察的向量,数据每 12 小时更新一次。

用 R,我可以做到

ts(vector_with_R, 频率=12)

在 statsmodels 中,“频率”控制时间序列的单位,而不是“数据窗口”。如何更改“数据窗口”。

0 投票
0 回答
1565 浏览

python - 使用 statsmodels.nonparametric.kde 而不是 scipy.stats.gaussian_kde

我读过使用该statsmodels.nonparametric.kde模块而不是scipy.stats.gaussian_kde可以显着提高速度

我有一个简单的代码块(4 行代码),我目前正在计算使用它,scipy.stats.gaussian_kde我想将它们替换为等效的statsmodels,看看我是否真的可以提高速度。

这是 MWE:

可以看出,只有 4 行代码需要替换。不幸的是,文档statsmodels.nonparametric.kde有点差,我不知道如何进行此类替换。

最后一行是最重要的,因为大部分计算时间都花在了这里(如此处所述加速内核估计采样)。

0 投票
1 回答
686 浏览

sympy - 如何在 sympy 中优化对 hessian 的评估?

我正在使用statsmodels通用似然模型的库。由于我有一个相当复杂的似然函数,我曾经sympy为我计算梯度和粗麻布。这很好用,但对我的需要来说太慢了,因为似然函数包含 term b0*x0 + b1*x1 + ... + bn*xn。这样,粗麻布尺寸就会增加,N^2复杂性也会增加。

expensive_operation * x0hessian 的元素通常与和等非常相似expensive_operation * x1。这意味着如果我可以预先计算expensive_operation并在 hessian 的函数中使用它,我将大大提高性能。

所以问题是 - 有没有一种工具可以列出功能,优化它们,然后有效地评估它们?类似numexprwhich 会列出功能的东西?

0 投票
2 回答
9321 浏览

python - Statsmodels OLS function for multiple regression parameters

Lets say I want to find the alpha (a) values for an equation which has something like

Using OLS lets say we start with 10 values for the basic case of i=2

Using statsmodel I would generally the following code to obtain the roots of nx1 x and y array:

But this does not work when x is not equivalent to y. The equation is here on the first page if you do not know what OLS.

0 投票
1 回答
11853 浏览

python - 从 Pandas 回归中获取回归线

我已经尝试使用 (pandas)pd.ols 和 (statsmodels)sm.ols 来获得带有回归线的回归散点图,我可以得到散点图,但我似乎无法获得参数来获取要绘制的回归线。很明显,我在这里进行了一些剪切和粘贴编码:-((以此为指导: http: //nbviewer.ipython.org/github/weecology/progbio/blob/master/ipynbs/statistics.ipynb

我的数据在 pandas DataFrame 中,x 列是 merge2[:-1].lastqu 和 y 数据列是 merge2[:-1].Units 我的代码现在如下:获取回归:

^^^^ 好像还可以

^^^^^ 这完成了散点图****并且下面没有给我回归线

数据框的片段: [:-1] 从数据中消除当前周期,该周期随后将成为投影

编辑:

我发现我可以这样做:

Statsmodels 文档中 所述,这似乎得到了我想要的主要内容(以及更多内容)我仍然想知道我在之前的代码中哪里出错了!

0 投票
2 回答
6788 浏览

python - Pandas Statsmodels ols 使用 DF 预测器进行回归预测?

使用 Pandas OLS,我能够拟合和使用如下模型:

我需要切换到 statsmodels 以获得一些额外的功能(主要是残差图见(问题在这里

所以现在我有:

和:

但我无法得到

或任何变体给我一个预测?请注意,pd.ols 使用相同的 merge2.lastqu[-1:] 来获取我想要“预测”的数据,无论我在 () 中放入什么来预测我都没有任何乐趣。似乎statsmodels 想要 () 中的特定内容,而不是 pandas DF 单元格我什至试图在其中放置一个数字,例如 2696,但仍然没有......我目前的错误是