问题标签 [statsmodels]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-2.7 - Python中的logit回归和奇异矩阵错误
我正在尝试对德国信用数据运行 logit 回归 (www4.stat.ncsu.edu/~boos/var.select/german.credit.html)。为了测试代码,我只使用了数值变量,并尝试使用以下代码对其结果进行回归。
当我检查数据时,所有 8.0 列似乎都是独立的。尽管如此,我得到了奇异矩阵错误。你能帮忙吗?
谢谢
python - 为什么 Python(scipy、statsmodels)中的 t-test 给出的结果与 R、Stata 或 Excel 不同?
(问题已解决;x,y 和 s1,s2 的大小不同)
在 R 中:
在 STATA 和 Excel 中获得相同的数字
无论我尝试哪种选项,我都无法使用 statsmodels.stats.weightstats.ttest_ind 或 scipy.stats.ttest_ind 复制相同的结果。
一定有成千上万的人使用 Python 计算 t-test。我们都得到不正确的结果吗?(我通常依赖 Python,但这次我用 STATA 检查了我的结果)。
python - Pandas Dataframe AttributeError:“DataFrame”对象没有属性“design_info”
我正在尝试使用OLS 实现的predict()
功能。statsmodels.formula.api
当我将新数据框传递给函数以获取样本外数据集的预测值时,result.predict(newdf)
返回以下错误:'DataFrame' object has no attribute 'design_info'
. 这是什么意思,我该如何解决?完整的追溯是:
编辑:这是一个可重现的例子。当我腌制然后取消腌制结果对象(我需要在我的实际项目中这样做)时,似乎会发生错误:
python - 如何将 Statsmodels 警告变成异常
Python 和 Panda 新手在这里。我正在尝试使用 statsmodels 来拟合逻辑回归来计算选民投票的概率。我在辖区一级工作;所以有时函数不收敛,我收到以下错误:警告:已超过最大迭代次数。
我已经将最大迭代次数增加到 1000 次。然后我试图将那个“警告”变成一个异常。我已导入警告并包含 warnings.simplefilter('error', Warning) 以尝试捕获它,但它似乎不是真正的 Python 警告。相反,它是 statsmodels 在达到最大迭代次数时打印出来的。
所以现在我想知道是否有办法说:
python - statsmodels 数据更新频率
考虑一个每小时观察的向量,数据每 12 小时更新一次。
用 R,我可以做到
ts(vector_with_R, 频率=12)
在 statsmodels 中,“频率”控制时间序列的单位,而不是“数据窗口”。如何更改“数据窗口”。
python - 使用 statsmodels.nonparametric.kde 而不是 scipy.stats.gaussian_kde
我读过使用该statsmodels.nonparametric.kde
模块而不是scipy.stats.gaussian_kde可以显着提高速度。
我有一个简单的代码块(4 行代码),我目前正在计算使用它,scipy.stats.gaussian_kde
我想将它们替换为等效的statsmodels
,看看我是否真的可以提高速度。
这是 MWE:
可以看出,只有 4 行代码需要替换。不幸的是,文档statsmodels.nonparametric.kde
有点差,我不知道如何进行此类替换。
最后一行是最重要的,因为大部分计算时间都花在了这里(如此处所述加速内核估计采样)。
sympy - 如何在 sympy 中优化对 hessian 的评估?
我正在使用statsmodels
通用似然模型的库。由于我有一个相当复杂的似然函数,我曾经sympy
为我计算梯度和粗麻布。这很好用,但对我的需要来说太慢了,因为似然函数包含 term b0*x0 + b1*x1 + ... + bn*xn
。这样,粗麻布尺寸就会增加,N^2
复杂性也会增加。
expensive_operation * x0
hessian 的元素通常与和等非常相似expensive_operation * x1
。这意味着如果我可以预先计算expensive_operation
并在 hessian 的函数中使用它,我将大大提高性能。
所以问题是 - 有没有一种工具可以列出功能,优化它们,然后有效地评估它们?类似numexpr
which 会列出功能的东西?
python - Statsmodels OLS function for multiple regression parameters
Lets say I want to find the alpha (a) values for an equation which has something like
Using OLS lets say we start with 10 values for the basic case of i=2
Using statsmodel I would generally the following code to obtain the roots of nx1 x and y array:
But this does not work when x is not equivalent to y. The equation is here on the first page if you do not know what OLS.
python - 从 Pandas 回归中获取回归线
我已经尝试使用 (pandas)pd.ols 和 (statsmodels)sm.ols 来获得带有回归线的回归散点图,我可以得到散点图,但我似乎无法获得参数来获取要绘制的回归线。很明显,我在这里进行了一些剪切和粘贴编码:-((以此为指导: http: //nbviewer.ipython.org/github/weecology/progbio/blob/master/ipynbs/statistics.ipynb
我的数据在 pandas DataFrame 中,x 列是 merge2[:-1].lastqu 和 y 数据列是 merge2[:-1].Units 我的代码现在如下:获取回归:
^^^^ 好像还可以
^^^^^ 这完成了散点图****并且下面没有给我回归线
数据框的片段: [:-1] 从数据中消除当前周期,该周期随后将成为投影
编辑:
我发现我可以这样做:
如Statsmodels 文档中 所述,这似乎得到了我想要的主要内容(以及更多内容)我仍然想知道我在之前的代码中哪里出错了!
python - Pandas Statsmodels ols 使用 DF 预测器进行回归预测?
使用 Pandas OLS,我能够拟合和使用如下模型:
我需要切换到 statsmodels 以获得一些额外的功能(主要是残差图见(问题在这里)
所以现在我有:
和:
但我无法得到
或任何变体给我一个预测?请注意,pd.ols 使用相同的 merge2.lastqu[-1:] 来获取我想要“预测”的数据,无论我在 () 中放入什么来预测我都没有任何乐趣。似乎statsmodels 想要 () 中的特定内容,而不是 pandas DF 单元格我什至试图在其中放置一个数字,例如 2696,但仍然没有......我目前的错误是