15

我是时间序列分析的新手。我试图找到短(1 天)温度时间序列的趋势并尝试不同的近似值。此外,采样频率为 2 分钟。数据被并置用于不同的站点。我会比较不同的趋势,看看它们是否相似。

在此过程中,我面临三个挑战:

Q1 - 我如何提取模式?

Q2 - 由于我会比较属于两个不同地方的趋势,我如何量化趋势?

Q3 - 我什么时候可以说两种趋势相似或不相似?

4

1 回答 1

11

Q1 - 如何提取模式?

您将从对两个数据集执行时间序列分析开始。您将需要一个统计库来进行测试和比较。

如果可以使用 Python,pandas是一个不错的选择。

在 R 中,这个forecast包很棒。首先ets在两个数据集上运行。

Q2 - 由于我会比较属于两个不同地方的趋势,我如何量化趋势?

量化趋势背后的想法是从寻找(线性)趋势线开始。所有统计数据包都可以帮助解决这个问题。例如,如果您假设一个线性趋势,那么最小化与您的数据点的平方偏差的线。

关于趋势估计的维基百科文章很容易获得。此外,请记住,趋势可以是线性的、指数的或阻尼的。可以尝试不同的趋势参数来处理这些问题。

Q3 - 我什么时候可以说两种趋势相似或不相似?

  1. 在两个数据集上运行 ARIMA。(这里的基本思想是查看相同的参数集(构成 ARIMA 模型)是否可以描述您的临时时间序列。如果您auto.arima()forecast(R) 中运行,那么它将选择参数 p,d,q您的数据,极大的方便。

  2. 另一个想法是对您的两个系列进行 2 样本 t 检验并检查 p 值的显着性。(警告:我不是统计学家,所以我不确定是否有任何理论反对对时间序列这样做。)

  3. 在研究过程中,我遇到了格兰杰检验——其基本思想是查看一个时间序列是否有助于预测另一个时间序列。似乎非常适用于您的情况。

所以这些只是让你开始的几件事。希望有帮助。

于 2012-12-12T20:58:29.223 回答