问题标签 [autoregressive-models]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 是否可以使用 AR、MA 和 ARMA 等统计模型对基于时间序列的数据进行分类?
我正在尝试对多元时间序列数据进行分类,并且我使用了 SVM、神经网络、基于 DTW 的 KNN 等机器学习算法。现在我将使用自动回归等统计模型对我的数据进行分类,以便这样做我已经在 R 中编写了一些代码,但似乎无法进行分类,因为结果是一些浮点数,而不是分类数。你有这种情况的经验吗?这是我的代码:
状态结果:
$状态
但是,我预计它是 0 或 1。
scala - Spark 中多元时间序列的自回归模型
我是 Spark 的新手。我想为多元时间序列实现向量自回归模型,最重要的是我想实现 ARIMA,但我不知道 Spark/Scala 是否可以实现这一点,只要算法应该被并行化以在集群上运行。
我的问题是:是否可以在 Spark 中使用向量自回归模型来处理多元时间序列?
提前致谢
regression-testing - OLS 的非平稳性 - Newey West
我正在对时间序列数据(利率掉期利差)进行 OLS 回归。我已经使用 Newey-West 标准误差运行回归来处理自相关和异方差。
我的问题是:这足以确保我的模型从假设检验的角度来看是合适的吗?或者我是否也需要使用一阶差分(因为数据不是固定的)?
谢谢你。
r - R中的滞后残差作为自变量
我正在建立一个因子模型来估计未来的股票回报。我想在这个模型中包含一个自回归残差项。我希望将昨天的误差(昨天的预测回报与实际回报之间的差异)作为自变量包含在回归中。这叫什么类型的自回归模型?我搜索了各种时间序列计量经济学文本,但没有找到描述的这个特定模型。我目前在 R 中的解决方案是在每个离散时间步 (t) 重新运行回归,并手动包含昨天的残差,但我很好奇是否有更有效的方法或包可以做到这一点。
下面是一些不包括残差项的示例代码:
r - 具有自回归的重复测量模型(SAS 和 R)
我正在尝试将重复测量模型与最初使用 SAS 拟合的自回归相匹配。SAS代码如下...
我试图匹配的输出是......
看来他们正在使用“重复测量方差分析”,据我所知,R 中不存在。我试图拟合的模型是......
我得到的输出与 SAS 产生的输出略有不同。因此,我想知道这是否与两个程序的差异有关,或者我是否未能在 R 中捕获整个 SAS 模型。我的数据看起来像这样......
r - R:构建 VAR 滞后结构
我正在寻找可以创建 VAR(p) 模型的滞后结构的函数或代码,因为我需要它来在其上运行其他一些函数。我编写了一个函数,可以在单变量情况下创建一个时间序列的滞后结构矩阵,但我不知道为多变量情况编写函数。或者在 R 中有任何实现吗?
一个简短的可重现示例是 3 维 VAR:
并假设我想构建一个 3 维 VAR(2) 模型的滞后矩阵
编辑
最终目标是使用包估计一个 5 维 VAR(20) lasso Regressionglmnet
r - R - 阈值线性回归模型
我正在寻找包含阈值回归模型或阈值自回归 (ar) 模型的 R 包,该模型具有时间序列的额外外生解释变量?到目前为止,我遇到了以下软件包,它们并没有完全捕捉到我正在寻找的行为:
- pdR(似乎是正确的选择,但是 ptm 函数适用于面板数据而不是时间序列数据,并且当我将多个横截面单位设置为 1 时不起作用)
- chngpt (类似于上面,而且不是我正在寻找的阈值规范)
- tsDyn(我想要事后阈值而不是转换矩阵)
- TAR(不能添加外生变量)
- threg (不能确切地说它做了什么,但不是我要找的东西)
您的帮助将非常受欢迎!
python - 如何使用 scikit LinearRegression 选择系数
我想为存储在数据框中的一些数据找到一个自回归模型,我每天有 96 个数据点。这些数据是某些地区的太阳辐照度值,我知道它有 1 天的季节性。我想使用 scikit LinearRegression 获得一个简单的线性模型,并且我想指定要使用哪些滞后数据点。我想使用最后 10 个数据点,加上滞后 97 的数据点,这对应于 24 小时前的数据点。如何指定要使用的滞后系数?我不想有 97 个系数,我只想使用其中的 11 个:前面的 10 个数据点和后面的 97 个数据点。
machine-learning - 将 sample_weights 与 fit_generator() 一起使用
在自回归连续问题中,当零点过多时,可以将这种情况视为零膨胀问题(即 ZIB)。换句话说,f(x)
我们想要拟合我们想要逼近g(x)*f(x)
的f(x)
函数,而不是拟合 ,即y
,并且g(x)
是一个输出0到1之间的值的函数,具体取决于值是零还是非零。
目前,我有两个模型。一个给我g(x)
的模型和另一个适合的模型g(x)*f(x)
。
第一个模型给了我一组权重。这是我需要你帮助的地方。我可以将sample_weights
参数与model.fit()
. 当我处理大量数据时,我需要使用model.fit_generator()
. 不过,fit_generator()
没有论据sample_weights
。
有什么办法可以在sample_weights
里面工作fit_generator()
吗?g(x)*f(x)
否则,知道我已经有一个训练有素的模型,我怎么能适应g(x)
?