问题标签 [statsmodels]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
7961 浏览

python - 在python中计算逻辑回归

我试图计算逻辑回归。我有数据作为 csv 文件。看起来像

这是我的编码。

当我在 python 中运行编码时,出现错误:

如何重写代码?

0 投票
1 回答
377 浏览

rabbitmq - 使用 Celery、RabbitMQ 和 statsmodels 永远挂起的任务

我正在尝试使用带有 RabbitMQ 的 Celery 分配一些线性回归任务。该设置适用于示例 add(x,y) 函数,但是当我实例化 statsmodels OLS 类时,例如

工作人员在消耗 100% CPU 的同时无限期挂起。

到底是怎么回事?

0 投票
5 回答
13513 浏览

python - ImportError:没有名为 statsmodels.api 的模块

我是python新手,遇到了这个问题。我已经安装了 Pandas、Numpy、Scipy,并使用 apt-get install python-statsmodels 安装了 Stats Models,但是当我尝试使用时:

但我有这个问题:

为什么??

0 投票
6 回答
72146 浏览

python - confidence and prediction intervals with StatsModels

I do this linear regression with StatsModels:

My questions are, iv_l and iv_u are the upper and lower confidence intervals or prediction intervals?

How I get others?

I need the confidence and prediction intervals for all points, to do a plot.

0 投票
1 回答
1624 浏览

python - statsmodel ARMA 函数与 Pandas 不兼容?

我有一个记录间隔为 30 秒的数据集,我正在尝试使用时间序列模块中的 ARMA 函数进行预测预测。由于数据隐私,我使用随机数据来重现错误

我的包版本:
Python 版本 2.7.3
pandas 版本 0.11.0
statsmodels 版本 0.5.0

主要错误信息如下(我省略了一些):

在我看来,ARMA 不支持熊猫生成的日期格式?如果我删除 date_range 中的 freq 选项,则此命令将再次不适用于大型系列,因为年份将远远超出 pandas 限制。

无论如何要绕过?谢谢

更新:好的,使用 data_series.values 会起作用,但是接下来,我该如何进行预测?我的 data_index 来自 [2013-05-26 00:00:00, ..., 2013-06-29 17:19:30]

仍然给我一个错误

我知道 prediction = model.predict() 可以通过并生成整个序列预测然后我可以匹配,但总的来说它不是那么方便。

0 投票
3 回答
5196 浏览

python - Python:不工作 StatsModels

我安装 statsmodels:

一切安装完成OK。pip 安装包的位置是/usr/local/lib/python2.7/dist-packages,这样可以吗?因为其他 python 包安装在 /usr/lib/python2.7/dist-packages 中。

当我在 Ipython Qt 控制台中运行此脚本时:

我收到此错误:

我使用 Linux Mint Mate 15

0 投票
1 回答
5417 浏览

python - 将 describe() 与加权数据一起使用——均值、标准差、中位数、分位数

我对 python 和 pandas 相当陌生(从使用 SAS 作为我的主力分析平台),所以如果这已经被问到/回答了,我提前道歉。(我已经搜索了文档以及该站点以寻找答案,但还没有找到任何东西。)

我有一个包含受访者级别调查数据的数据框(称为 resp)。我想对其中一个字段(称为 nninc [年收入的缩写])执行一些基本的描述性统计。

这给了我基本的统计数据:

但有一个问题。鉴于样本的构建方式,需要对受访者数据进行加权调整,以便在执行分析时并非每个人都被视为“平等”。我在数据框中有另一列(称为 tufnwgrp),表示分析期间应应用于每条记录的权重。

在我之前的 SAS 生活中,大多数 proc 都可以选择使用这样的权重处理数据。例如,给出相同结果的标准 proc 单变量看起来像这样:

使用加权数据的相同分析看起来像这样:

pandas 中是否有类似的加权选项可用于 describe() 等方法?

0 投票
1 回答
1838 浏览

python - Python Pandas中加权最小二乘的意外标准误差

Python Pandas 中主要 OLS 类的代码中,我正在寻求帮助,以阐明在执行加权 OLS 时报告的标准错误和 t-stats 使用了哪些约定。

这是我的示例数据集,其中包含一些使用 Pandas 和直接使用 scikits.statsmodels WLS 的导入:

我使用%cpaste在 IPython 中执行此操作,然后打印两个回归的摘要:

注意不匹配的标准错误:Pandas 声称标准错误是[0.9079, 1.0191],而 statsmodels 说[0.295, 0.333].

回到我在帖子顶部链接的代码中,我试图追踪不匹配的来源。

首先,您可以看到标准错误是函数报告的:

所以看着self._var_beta_raw我发现:

在我的用例中,self._nw_lags总是None如此,所以令人费解的是第一部分。由于xx只是回归矩阵的标准乘积:x.T.dot(x),我想知道权重如何影响这一点。该术语self._rmse_raw直接来自于 的构造函数中拟合的 statsmodels 回归OLS,因此绝对包含权重。

这会提示这些问题:

  1. 为什么在 RMSE 部分中使用权重报告标准误差,而不是在回归变量中。
  2. 如果您想要“未转换”的变量,这是标准做法吗(您难道不也想要未转换的 RMSE 吗??)有没有办法让 Pandas 返回标准误差的全加权版本?
  3. 为什么所有的误导?在构造函数中,计算了完整的 statsmodels 拟合回归。为什么绝对不是每个汇总统计数据都直接来自那里?为什么要混搭,有的来自 statsmodels 输出,有的来自 Pandas 家常计算?

看起来我可以通过执行以下操作来协调 Pandas 输出:

我只是对这种关系感到非常困惑。这在统计学家中是不是很常见:将权重与 RMSE 部分结合起来,然后在计算系数的标准误差时选择是否对变量进行加权?如果是这样的话,为什么 Pandas 和 statsmodels 之间的系数本身也不同,因为这些系数同样是从首先由 statsmodels 转换的变量导出的?

作为参考,这是我的玩具示例中使用的完整数据集(以防万一np.random.seed不足以使其可重现):

0 投票
13 回答
85784 浏览

python - ValueError: numpy.dtype 的大小错误,尝试重新编译

我刚刚在我的 python 2.7 上安装了 pandas 和 statsmodels 包当我尝试“import pandas as pd”时,出现了这个错误消息。任何人都可以帮忙吗?谢谢!!!

0 投票
0 回答
451 浏览

macos - python中的iolib导入错误

在 Mac OS X Mountain Lion 上,我尝试

我收到此错误:

如果我添加

我明白了

我曾尝试在网上搜索,但我被困在这个网上。有任何想法吗?