1

我有一个带有两个系列的 DataFrame,我知道如何使用所有数据点来获得它们的协整...

import pandas as pd
import numpy as np
import statsmodels.tsa.stattools as ts

A = pd.Series(np.cumsum(np.random.normal(size=100)) + 50)
B = pd.Series(A + 5 + np.random.normal(size=100))

ts.coint(A, B)

但是,我想通过使用滚动窗口(比如说 60 天)来探索这种协整是如何随时间变化的。如何结合使用 statsmodels 和 pandas 来实现这一目标?

提前致谢!

4

2 回答 2

1

您可以通过首先创建一个数据框,分配一个整数位置系列,然后使用 pandasrolling函数和一个 lambda 函数来提取ts.coint' 返回的第一个元素来实现这一点。

所以修改你的代码我们得到:

import pandas as pd
import numpy as np
import statsmodels.tsa.stattools as ts

A = pd.Series(np.cumsum(np.random.normal(size=1000)) + 50, name='A')
B = pd.Series(A + 5 + np.random.normal(size=1000), name='B')

df = pd.concat([A, B], axis=1)
df['ii'] = range(len(df))

df['ii'].rolling(100).apply(lambda ii: ts.coint(df.loc[ii, 'A'], df.loc[ii, 'B'])[0])

为了说明这一点,我将系列的大小增加到 1000 并将滚动窗口设置为 100(但您可以使用 中的选项rolling)。

于 2018-06-19T04:38:41.053 回答
0

Series.index.map()鉴于两个系列的长度相同,您可以使用它。如果系列 A 和 B 从 0 开始索引:

C = A.index.map(lambda i: ts.coint(A[i-60:i], B[i-60:i])[0] if i >= 60 else np.nan)

如果系列索引是其他东西(即日期时间),您需要先重置索引并iloc用于定位:

C = A.reset_index().index.map(lambda i: ts.coint(A.iloc[i-60:i], B.iloc[i-60:i])[0] if i >= 60 else np.nan)
于 2022-01-23T10:47:19.117 回答