问题标签 [statsmodels]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 调用参数时statsmodles AR模型错误
statsmodels 新手,尝试使用 statsmodels.tsa.ar_model 来拟合 pandas 时间序列。
得到以下错误:
有任何想法吗?
python - 带有 Hive 流的 Python 2.7 模块
我正在使用 Python 映射器在 DSE 3.0 集群(Hive 0.9)上进行 Hive 流处理。我的 python 脚本导入了需要 Python 2.7 的 statsmodels 模块。由于默认不是 2.7(它是 2.4),我下载并安装它,以及 statsmodels 模块。
但是,在运行简单的 Hive 查询时
其中“docs”是带有行 STRING 的 Hive 表。但是,我收到错误:
所以我将我的 Hive 查询更改为:
调用 2.7 版。但后来我得到了错误
我也尝试过 python27 和 /usr/local/bin/python2.7 并且仍然遇到相同的错误。有没有人遇到过这个?我已经参考了文章On linux SUSE or RedHat, how do I load Python 2.7的第二个答案。任何建议将不胜感激!
谢谢,上午
python - 对非均匀间隔时间序列进行季节性分解,R 或 Python 中是否有任何完善的算法?
R 中的 stats 包具有 stl(),但它需要由 ts() 创建的均匀间隔的时间序列。它不能处理动物园对象。
奇怪的是,它也不能处理缺失值,尽管 STL 方法声称能够用 LOESS 填充缺失值。(见简历上的这个问题。)
因此,例如,如果您有工作日数据,则不能通过将 NA 放在周末并调用 stl() 来使其成为日历日。
我还看到 Python statsmodel 的作者试图迁移 stl() 以使用 Pandas TimeSeries,但它似乎还没有。
谢谢
编辑:补充一点,我知道我可以做一个非常简单的模型,比如拟合谐波,但我想要一个完善的模型,至少可以提供基准。我有分月数据,所以 X12 不适用。
python - 模型预测的置信区间
我正在关注statsmodels 教程
OLS 模型配有
预测值通过以下方式提供:
lm.predict({'X' : [12], 'M' : [1], 'E' : [2]})
结果作为单值数组返回。
是否有一种方法可以在 statsmodels 中返回预测值(预测区间)的置信区间?
谢谢。
python - Python statsmodels OLS:如何将学习模型保存到文件
我正在尝试使用 Python 的 statsmodels 库学习一个普通的最小二乘模型,如此处所述。
sm.OLS.fit() 返回学习模型。有没有办法将其保存到文件并重新加载?我的训练数据很大,学习模型大约需要半分钟。所以我想知道 OLS 模型中是否存在任何保存/加载功能。
我在模型对象上尝试了该repr()
方法,但它没有返回任何有用的信息。
python - Statsmodels:如何使用 get_rdataset
每次我尝试使用 sm.datasets.get_rdataset 时都会收到错误消息:
我正在使用我使用 pip 安装的最新版本的 statsmodels (0.5.0.dev-1bbd4ca)。我在安装日志中看到 pip 从 github 下载源代码。
我会非常感谢你的帮助
安迪
python - statsmodels:使用 patsy 指定非线性回归模型
我正在尝试使用 statsmodles 计算非线性回归模型。特别是我在学习 patsy 语法时遇到了问题。
是否有任何教程或示例如何使用 patsy 语法来制定非线性模型?
特别是,如何使用 patsy 指定此示例 ( http://statsmodels.sourceforge.net/devel/examples/generated/example_ols.html )上的非线性模型?
非常感谢您提前
安迪
python - Python 2.7 - statsmodels - 格式化和编写摘要输出
我正在使用pandas 0.11.0
(数据处理)进行逻辑回归并statsmodels 0.4.3
在 Mac OSX Lion 上进行实际回归。
我将运行约 2,900 个不同的逻辑回归模型,并且需要将结果输出到 csv 文件并以特定方式格式化。
目前,我只知道print result.summary()
将结果(如下)打印到shell:
我还需要优势比,它由 计算print np.exp(result.params)
,并打印在外壳中,如下所示:
我需要将这些都以非常长的行的形式写入 csv 文件(我不确定,在这一点上,我是否需要类似的东西Log-Likelihood
,但为了彻底起见已经包含了它):
我想你明白了——一个很长的行,包含所有这些实际值,以及一个包含所有列名称的标题都采用类似的格式。
我熟悉csv module
Python 中的 ,并且越来越熟悉pandas
. 不确定是否可以将此信息格式化并存储在 a 中pandas dataframe
,然后to_csv
在所有约 2,900 个逻辑回归模型完成后将其写入文件;那肯定没问题。此外,在每个模型完成时编写它们也很好(使用csv module
)。
更新:
所以,我更多地关注 statsmodels 站点,特别是试图弄清楚模型的结果是如何存储在类中的。看起来有一个名为“Results”的类,需要使用它。我认为使用这个类的继承来创建另一个类,其中一些方法/运算符发生变化可能是要走的路,以获得我需要的格式。我在这方面的经验很少,需要花很多时间来解决这个问题(这很好)。如果有人可以提供帮助/有更多经验,那就太棒了!
这是布置类的站点:statsmodels 结果类
python - Python 2.7- statsmodels - result.conf_int()
这篇文章是对此处找到的帖子的补充:Python 2.7 - statsmodels - 格式化和编写摘要输出
我得到了我需要的所有格式,除了置信区间给我带来了问题。
我尝试了许多不同的方法,包括:
打印时返回:
同样,我尝试过:
但得到错误:
当我尝试时同样的事情:
python-2.7 - 总结用 scikits.statsmodels.api 除以零误差
我正在构建一个 OLS 回归模型,我想做一个小测试(如下所示)。我很好地创建了输入数据,当我告诉模型适合它时,但是当我要求摘要时,我得到一个除以零的错误。这是一些代码(我已经在这里换掉了随机调用的实际数据)
在回溯中,除以零发生在 linear_model.pyc