问题标签 [statsmodels]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

2459 问题

0 投票

1 回答

607 浏览

python - 调用参数时statsmodles AR模型错误

statsmodels 新手，尝试使用 statsmodels.tsa.ar_model 来拟合 pandas 时间序列。

得到以下错误：

有任何想法吗？

2013-04-21T04:59:01.047

0 投票

1 回答

1710 浏览

python - 带有 Hive 流的 Python 2.7 模块

我正在使用 Python 映射器在 DSE 3.0 集群（Hive 0.9）上进行 Hive 流处理。我的 python 脚本导入了需要 Python 2.7 的 statsmodels 模块。由于默认不是 2.7（它是 2.4），我下载并安装它，以及 statsmodels 模块。

但是，在运行简单的 Hive 查询时

其中“docs”是带有行 STRING 的 Hive 表。但是，我收到错误：

所以我将我的 Hive 查询更改为：

调用 2.7 版。但后来我得到了错误

我也尝试过 python27 和 /usr/local/bin/python2.7 并且仍然遇到相同的错误。有没有人遇到过这个？我已经参考了文章On linux SUSE or RedHat, how do I load Python 2.7的第二个答案。任何建议将不胜感激！

谢谢，上午

python streaming hive statsmodels

2013-04-23T16:42:19.873

0 投票

1 回答

1152 浏览

python - 对非均匀间隔时间序列进行季节性分解，R 或 Python 中是否有任何完善的算法？

R 中的 stats 包具有 stl()，但它需要由 ts() 创建的均匀间隔的时间序列。它不能处理动物园对象。

奇怪的是，它也不能处理缺失值，尽管 STL 方法声称能够用 LOESS 填充缺失值。（见简历上的这个问题。）

因此，例如，如果您有工作日数据，则不能通过将 NA 放在周末并调用 stl() 来使其成为日历日。

我还看到 Python statsmodel 的作者试图迁移 stl() 以使用 Pandas TimeSeries，但它似乎还没有。

谢谢

编辑：补充一点，我知道我可以做一个非常简单的模型，比如拟合谐波，但我想要一个完善的模型，至少可以提供基准。我有分月数据，所以 X12 不适用。

python r time-series statsmodels stl-decomposition

2013-04-24T12:36:10.723

0 投票

2 回答

6161 浏览

python - 模型预测的置信区间

我正在关注statsmodels 教程

OLS 模型配有

预测值通过以下方式提供：

lm.predict({'X' : [12], 'M' : [1], 'E' : [2]})

结果作为单值数组返回。

是否有一种方法可以在 statsmodels 中返回预测值（预测区间）的置信区间？

谢谢。

python statsmodels

2013-04-27T03:25:51.233

0 投票

2 回答

18352 浏览

python - Python statsmodels OLS：如何将学习模型保存到文件

我正在尝试使用 Python 的 statsmodels 库学习一个普通的最小二乘模型，如此处所述。

sm.OLS.fit() 返回学习模型。有没有办法将其保存到文件并重新加载？我的训练数据很大，学习模型大约需要半分钟。所以我想知道 OLS 模型中是否存在任何保存/加载功能。

我在模型对象上尝试了该repr()方法，但它没有返回任何有用的信息。

python least-squares statsmodels

Nik

2013-05-07T08:53:00.270

0 投票

2 回答

650 浏览

python - Statsmodels：如何使用 get_rdataset

每次我尝试使用 sm.datasets.get_rdataset 时都会收到错误消息：

我正在使用我使用 pip 安装的最新版本的 statsmodels (0.5.0.dev-1bbd4ca)。我在安装日志中看到 pip 从 github 下载源代码。

我会非常感谢你的帮助

安迪

python dataset statsmodels

2013-05-19T13:19:42.773

0 投票

1 回答

5322 浏览

python - statsmodels：使用 patsy 指定非线性回归模型

我正在尝试使用 statsmodles 计算非线性回归模型。特别是我在学习 patsy 语法时遇到了问题。

是否有任何教程或示例如何使用 patsy 语法来制定非线性模型？

特别是，如何使用 patsy 指定此示例 ( http://statsmodels.sourceforge.net/devel/examples/generated/example_ols.html )上的非线性模型？

非常感谢您提前

安迪

python regression statsmodels

2013-05-21T08:53:23.927

0 投票

5 回答

21868 浏览

python - Python 2.7 - statsmodels - 格式化和编写摘要输出

我正在使用pandas 0.11.0（数据处理）进行逻辑回归并statsmodels 0.4.3在 Mac OSX Lion 上进行实际回归。

我将运行约 2,900 个不同的逻辑回归模型，并且需要将结果输出到 csv 文件并以特定方式格式化。

目前，我只知道print result.summary()将结果（如下）打印到shell：

我还需要优势比，它由计算print np.exp(result.params)，并打印在外壳中，如下所示：

我需要将这些都以非常长的行的形式写入 csv 文件（我不确定，在这一点上，我是否需要类似的东西Log-Likelihood，但为了彻底起见已经包含了它）：

我想你明白了——一个很长的行，包含所有这些实际值，以及一个包含所有列名称的标题都采用类似的格式。

我熟悉csv modulePython 中的，并且越来越熟悉pandas. 不确定是否可以将此信息格式化并存储在 a 中pandas dataframe，然后to_csv在所有约 2,900 个逻辑回归模型完成后将其写入文件；那肯定没问题。此外，在每个模型完成时编写它们也很好（使用csv module）。

更新：

所以，我更多地关注 statsmodels 站点，特别是试图弄清楚模型的结果是如何存储在类中的。看起来有一个名为“Results”的类，需要使用它。我认为使用这个类的继承来创建另一个类，其中一些方法/运算符发生变化可能是要走的路，以获得我需要的格式。我在这方面的经验很少，需要花很多时间来解决这个问题（这很好）。如果有人可以提供帮助/有更多经验，那就太棒了！

这是布置类的站点：statsmodels 结果类

python python-2.7 pandas statsmodels

2013-05-23T04:19:17.097

0 投票

2 回答

4102 浏览

python - Python 2.7- statsmodels - result.conf_int()

这篇文章是对此处找到的帖子的补充：Python 2.7 - statsmodels - 格式化和编写摘要输出

我得到了我需要的所有格式，除了置信区间给我带来了问题。

我尝试了许多不同的方法，包括：

打印时返回：

同样，我尝试过：

但得到错误：

当我尝试时同样的事情：

我也尝试在此处（我有 0.4.3 并且找不到此版本的页面）和此处查找它。两者都没有帮助解决这个问题。

python python-2.7 statsmodels

2013-05-30T00:01:00.030

0 投票

2 回答

1631 浏览

python-2.7 - 总结用 scikits.statsmodels.api 除以零误差

我正在构建一个 OLS 回归模型，我想做一个小测试（如下所示）。我很好地创建了输入数据，当我告诉模型适合它时，但是当我要求摘要时，我得到一个除以零的错误。这是一些代码（我已经在这里换掉了随机调用的实际数据）

在回溯中，除以零发生在 linear_model.pyc

python-2.7 statsmodels

2013-06-13T18:24:39.667

1 2 3 4 5 6 7 8 9 10

问题标签 [statsmodels]

Reference