问题标签 [statsmodels]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
26911 浏览

python - python时间序列分析包

我正在研究python中的时间序列。我发现有用和有希望的图书馆是

  • 熊猫;
  • statsmodel(用于 ARIMA);
  • pandas 提供了简单的指数平滑。

也用于可视化:matplotlib

有谁知道指数平滑库?

0 投票
1 回答
3398 浏览

python - 升级 Python 模块的最佳实践

我已经学习 Python 几个月了,但现在我发现我的 2.7 安装存在一些问题,因为我研究了诸如 nltk 之类的模块。

但是,当我想使用帮助(“模块)列出模块时,我有一个主要错误,我认为可以解释问题是:

我还收到以下与不推荐使用的模块有关的错误:

我仍在努力掌握路径。以后如何避免这个问题?

0 投票
2 回答
49087 浏览

python - 使用带有 statsmodels 的 OLS 模型预测值

我使用 OLS(多元线性回归)计算了一个模型。我将数据划分为训练和测试(各一半),然后我想预测第二半标签的值。

问题是我得到了错误:文件“/usr/local/lib/python2.7/dist-packages/statsmodels-0.5.0-py2.7-linux-i686.egg/statsmodels/regression/linear_model.py” ,第 281 行,在预测返回 np.dot(exog, params) ValueError: 矩阵未对齐

我有以下数组形状: data.shape: (426, 215) labels.shape: (426,)

如果我将输入转换为 model.predict,我确实得到了一个结果,但形状为 (426,213),所以我认为它也是错误的(我希望一个包含 213 个数字的向量作为标签预测):

知道如何让它工作吗?

0 投票
1 回答
16289 浏览

python - 用什么做多重关联?

我正在尝试使用 python 来计算响应数组和一组预测变量之间的多重线性回归和多重相关性。我看到了计算多元线性回归的非常简单的示例,这很容易。但是如何使用 statsmodels 计算多重相关性呢?或与其他任何东西,作为替代。我想我可以使用 rpy 和 R,但如果可能的话,我更愿意留在 python 中。

编辑[澄清]:考虑到这里描述的情况:http: //sphweb.bumc.bu.edu/otlt/MPH-Modules/BS/BS704-EP713_MultivariableMethods/ 我还想计算预测变量的多个相关系数, 除了回归系数和其他回归参数

0 投票
1 回答
1209 浏览

python - python statsmodels.tsa.stattools.pacf 带掩码数组?

在 statsmodels 例程中使用掩码数组(或包含 nan 的数组)是否有一般技巧?例如 pacf 和 acf?

0 投票
2 回答
3646 浏览

python - 使用 pandas 和 matplotlib 对股票数据进行回归

我想在股票图表上绘制 Excel 所谓的“指数趋势/回归”。当我在 IPython 笔记本中运行下面的代码时,它只是说“内核已经死了,你想重新启动它吗?”。关于如何解决它的任何想法?此外,这只是尝试进行线性回归,我不太确定如何对指数数据进行回归。

0 投票
2 回答
2422 浏览

python - Statsmodels 公式 API (patsy):如何排除交互组件的子集?

我正在statsmodels.formula.api.wls使用 statsmodels 公式 API(来自 patsy)构建 WLS ( ) 模型,并且正在使用因子之间的交互。其中一些是预测性的,而另一些则不是。有没有办法在模型中只包含交互的子集,而无需手动构建设计矩阵?

或者,有没有办法将模型变量子集的估计系数约束为零?

0 投票
1 回答
14081 浏览

python - python中的ECDF没有阶梯函数?

我一直在使用 statsmodels.distributions 中的 ECDF(经验累积分布函数)来绘制一些数据的 CDF。但是,ECDF 使用阶跃函数,因此我得到了锯齿状的图。

在此处输入图像描述

所以我的问题是:scipy 或 statsmodels 是否有一个没有阶跃函数的 ECDF 烘焙?

顺便说一句,我知道我可以这样做:

但我没有得到正确的秤。

谢谢!

0 投票
3 回答
15882 浏览

python - Python统计包:statsmodel和scipy.stats的区别

我需要一些关于为 Python 选择统计数据包的建议,我已经做了很多搜索,但不确定我是否一切都正确,特别是关于 statsmodels 和 scipy.stats 之间的差异。

我知道的一件事是具有 scikits 命名空间的那些是 scipy 的特定“分支”,而过去的 scikits.statsmodels 现在称为 statsmodels。另一方面,还有 scipy.stats。两者有什么区别,哪个是Python统计包?

谢谢。

- 编辑 -

我更改了标题,因为有些答案与问题并没有真正相关,我想那是因为标题不够清楚。

0 投票
1 回答
372 浏览

python - 确保 statsmodels predict 中的一致时间索引

我正在尝试将 AR(1) 模型拟合到 Pandas 时间序列并向前推进。数据为年度数据,每年从 4 月 1 日开始。当我使用statsmodels.tsa.ar_model.AR.predict估计模型进行预测时,输出是 Pandas 时间序列,年度预测以 12 月 31 日为中心。

代码:

输出:

我可以获得 predict 方法来创建索引于 4 月 1 日的时间序列,还是必须在创建预测序列后重新索引它?我希望能够将它与数据框中的其他系列进行比较,因此索引非常重要。

谢谢你的帮助!