问题标签 [statsmodels]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
607 浏览

python - 调用参数时statsmodles AR模型错误

statsmodels 新手,尝试使用 statsmodels.tsa.ar_model 来拟合 pandas 时间序列。

得到以下错误:

有任何想法吗?

0 投票
1 回答
1710 浏览

python - 带有 Hive 流的 Python 2.7 模块

我正在使用 Python 映射器在 DSE 3.0 集群(Hive 0.9)上进行 Hive 流处理。我的 python 脚本导入了需要 Python 2.7 的 statsmodels 模块。由于默认不是 2.7(它是 2.4),我下载并安装它,以及 statsmodels 模块。

但是,在运行简单的 Hive 查询时

其中“docs”是带有行 STRING 的 Hive 表。但是,我收到错误:

所以我将我的 Hive 查询更改为:

调用 2.7 版。但后来我得到了错误

我也尝试过 python27 和 /usr/local/bin/python2.7 并且仍然遇到相同的错误。有没有人遇到过这个?我已经参考了文章On linux SUSE or RedHat, how do I load Python 2.7的第二个答案。任何建议将不胜感激!

谢谢,上午

0 投票
1 回答
1152 浏览

python - 对非均匀间隔时间序列进行季节性分解,R 或 Python 中是否有任何完善的算法?

R 中的 stats 包具有 stl(),但它需要由 ts() 创建的均匀间隔的时间序列。它不能处理动物园对象。

奇怪的是,它也不能处理缺失值,尽管 STL 方法声称能够用 LOESS 填充缺失值。(见简历上的这个问题。)

因此,例如,如果您有工作日数据,则不能通过将 NA 放在周末并调用 stl() 来使其成为日历日。

我还看到 Python statsmodel 的作者试图迁移 stl() 以使用 Pandas TimeSeries,但它似乎还没有。

谢谢

编辑:补充一点,我知道我可以做一个非常简单的模型,比如拟合谐波,但我想要一个完善的模型,至少可以提供基准。我有分月数据,所以 X12 不适用。

0 投票
2 回答
6161 浏览

python - 模型预测的置信区间

我正在关注statsmodels 教程

OLS 模型配有

预测值通过以下方式提供:

lm.predict({'X' : [12], 'M' : [1], 'E' : [2]})

结果作为单值数组返回。

是否有一种方法可以在 statsmodels 中返回预测值(预测区间)的置信区间?

谢谢。

0 投票
2 回答
18352 浏览

python - Python statsmodels OLS:如何将学习模型保存到文件

我正在尝试使用 Python 的 statsmodels 库学习一个普通的最小二乘模型,如此处所述

sm.OLS.fit() 返回学习模型。有没有办法将其保存到文件并重新加载?我的训练数据很大,学习模型大约需要半分钟。所以我想知道 OLS 模型中是否存在任何保存/加载功能。

我在模型对象上尝试了该repr()方法,但它没有返回任何有用的信息。

0 投票
2 回答
650 浏览

python - Statsmodels:如何使用 get_rdataset

每次我尝试使用 sm.datasets.get_rdataset 时都会收到错误消息:

我正在使用我使用 pip 安装的最新版本的 statsmodels (0.5.0.dev-1bbd4ca)。我在安装日志中看到 pip 从 github 下载源代码。

我会非常感谢你的帮助

安迪

0 投票
1 回答
5322 浏览

python - statsmodels:使用 patsy 指定非线性回归模型

我正在尝试使用 statsmodles 计算非线性回归模型。特别是我在学习 patsy 语法时遇到了问题。

是否有任何教程或示例如何使用 patsy 语法来制定非线性模型?

特别是,如何使用 patsy 指定此示例 ( http://statsmodels.sourceforge.net/devel/examples/generated/example_ols.html )上的非线性模型?

非常感谢您提前

安迪

0 投票
5 回答
21868 浏览

python - Python 2.7 - statsmodels - 格式化和编写摘要输出

我正在使用pandas 0.11.0(数据处理)进行逻辑回归并statsmodels 0.4.3在 Mac OSX Lion 上进行实际回归。

我将运行约 2,900 个不同的逻辑回归模型,并且需要将结果输出到 csv 文件并以特定方式格式化。

目前,我只知道print result.summary()将结果(如下)打印到shell:

我还需要优势比,它由 计算print np.exp(result.params),并打印在外壳中,如下所示:

我需要将这些都以非常长的行的形式写入 csv 文件(我不确定,在这一点上,我是否需要类似的东西Log-Likelihood,但为了彻底起见已经包含了它):

我想你明白了——一个很长的行,包含所有这些实际值,以及一个包含所有列名称的标题都采用类似的格式。

我熟悉csv modulePython 中的 ,并且越来越熟悉pandas. 不确定是否可以将此信息格式化并存储在 a 中pandas dataframe,然后to_csv在所有约 2,900 个逻辑回归模型完成后将其写入文件;那肯定没问题。此外,在每个模型完成时编写它们也很好(使用csv module)。

更新:

所以,我更多地关注 statsmodels 站点,特别是试图弄清楚模型的结果是如何存储在类中的。看起来有一个名为“Results”的类,需要使用它。我认为使用这个类的继承来创建另一个类,其中一些方法/运算符发生变化可能是要走的路,以获得我需要的格式。我在这方面的经验很少,需要花很多时间来解决这个问题(这很好)。如果有人可以提供帮助/有更多经验,那就太棒了!

这是布置类的站点:statsmodels 结果类

0 投票
2 回答
4102 浏览

python - Python 2.7- statsmodels - result.conf_int()

这篇文章是对此处找到的帖子的补充:Python 2.7 - statsmodels - 格式化和编写摘要输出

我得到了我需要的所有格式,除了置信区间给我带来了问题。

我尝试了许多不同的方法,包括:

打印时返回:

同样,我尝试过:

但得到错误:

当我尝试时同样的事情:

我也尝试在此处(我有 0.4.3 并且找不到此版本的页面)和此处查找它。两者都没有帮助解决这个问题。

0 投票
2 回答
1631 浏览

python-2.7 - 总结用 scikits.statsmodels.api 除以零误差

我正在构建一个 OLS 回归模型,我想做一个小测试(如下所示)。我很好地创建了输入数据,当我告诉模型适合它时,但是当我要求摘要时,我得到一个除以零的错误。这是一些代码(我已经在这里换掉了随机调用的实际数据)

在回溯中,除以零发生在 linear_model.pyc