问题标签 [statsmodels]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - python时间序列分析包
我正在研究python中的时间序列。我发现有用和有希望的图书馆是
- 熊猫;
- statsmodel(用于 ARIMA);
- pandas 提供了简单的指数平滑。
也用于可视化:matplotlib
有谁知道指数平滑库?
python - 升级 Python 模块的最佳实践
我已经学习 Python 几个月了,但现在我发现我的 2.7 安装存在一些问题,因为我研究了诸如 nltk 之类的模块。
但是,当我想使用帮助(“模块)列出模块时,我有一个主要错误,我认为可以解释问题是:
我还收到以下与不推荐使用的模块有关的错误:
我仍在努力掌握路径。以后如何避免这个问题?
python - 使用带有 statsmodels 的 OLS 模型预测值
我使用 OLS(多元线性回归)计算了一个模型。我将数据划分为训练和测试(各一半),然后我想预测第二半标签的值。
问题是我得到了错误:文件“/usr/local/lib/python2.7/dist-packages/statsmodels-0.5.0-py2.7-linux-i686.egg/statsmodels/regression/linear_model.py” ,第 281 行,在预测返回 np.dot(exog, params) ValueError: 矩阵未对齐
我有以下数组形状: data.shape: (426, 215) labels.shape: (426,)
如果我将输入转换为 model.predict,我确实得到了一个结果,但形状为 (426,213),所以我认为它也是错误的(我希望一个包含 213 个数字的向量作为标签预测):
知道如何让它工作吗?
python - 用什么做多重关联?
我正在尝试使用 python 来计算响应数组和一组预测变量之间的多重线性回归和多重相关性。我看到了计算多元线性回归的非常简单的示例,这很容易。但是如何使用 statsmodels 计算多重相关性呢?或与其他任何东西,作为替代。我想我可以使用 rpy 和 R,但如果可能的话,我更愿意留在 python 中。
编辑[澄清]:考虑到这里描述的情况:http: //sphweb.bumc.bu.edu/otlt/MPH-Modules/BS/BS704-EP713_MultivariableMethods/ 我还想计算预测变量的多个相关系数, 除了回归系数和其他回归参数
python - python statsmodels.tsa.stattools.pacf 带掩码数组?
在 statsmodels 例程中使用掩码数组(或包含 nan 的数组)是否有一般技巧?例如 pacf 和 acf?
python - 使用 pandas 和 matplotlib 对股票数据进行回归
我想在股票图表上绘制 Excel 所谓的“指数趋势/回归”。当我在 IPython 笔记本中运行下面的代码时,它只是说“内核已经死了,你想重新启动它吗?”。关于如何解决它的任何想法?此外,这只是尝试进行线性回归,我不太确定如何对指数数据进行回归。
python - Statsmodels 公式 API (patsy):如何排除交互组件的子集?
我正在statsmodels.formula.api.wls
使用 statsmodels 公式 API(来自 patsy)构建 WLS ( ) 模型,并且正在使用因子之间的交互。其中一些是预测性的,而另一些则不是。有没有办法在模型中只包含交互的子集,而无需手动构建设计矩阵?
或者,有没有办法将模型变量子集的估计系数约束为零?
python - python中的ECDF没有阶梯函数?
我一直在使用 statsmodels.distributions 中的 ECDF(经验累积分布函数)来绘制一些数据的 CDF。但是,ECDF 使用阶跃函数,因此我得到了锯齿状的图。
所以我的问题是:scipy 或 statsmodels 是否有一个没有阶跃函数的 ECDF 烘焙?
顺便说一句,我知道我可以这样做:
但我没有得到正确的秤。
谢谢!
python - Python统计包:statsmodel和scipy.stats的区别
我需要一些关于为 Python 选择统计数据包的建议,我已经做了很多搜索,但不确定我是否一切都正确,特别是关于 statsmodels 和 scipy.stats 之间的差异。
我知道的一件事是具有 scikits 命名空间的那些是 scipy 的特定“分支”,而过去的 scikits.statsmodels 现在称为 statsmodels。另一方面,还有 scipy.stats。两者有什么区别,哪个是Python的统计包?
谢谢。
- 编辑 -
我更改了标题,因为有些答案与问题并没有真正相关,我想那是因为标题不够清楚。
python - 确保 statsmodels predict 中的一致时间索引
我正在尝试将 AR(1) 模型拟合到 Pandas 时间序列并向前推进。数据为年度数据,每年从 4 月 1 日开始。当我使用statsmodels.tsa.ar_model.AR.predict
估计模型进行预测时,输出是 Pandas 时间序列,年度预测以 12 月 31 日为中心。
代码:
输出:
我可以获得 predict 方法来创建索引于 4 月 1 日的时间序列,还是必须在创建预测序列后重新索引它?我希望能够将它与数据框中的其他系列进行比较,因此索引非常重要。
谢谢你的帮助!