0

我正在使用具有时间索引的熊猫数据框。我有几年的日常数据,我需要做一些季节性的比较。

我知道我可以使用该truncate方法来提取周期并创建新的时间序列来使用,但我想知道我是否可以定义一个自定义的“周期”(例如 5 月 1 日到 9 月 1 日)。然后我想仅在该期间计算两个不同时间序列之间的相关系数。有没有办法做到这一点?

一些示例数据:

import pandas as pd
import numpy as np

rng = pd.date_range('1/1/2000', periods=4380, freq='D')
df = pd.DataFrame(np.random.randn(4380, 4), index=rng)

问题:

我想计算这些时间序列的相关系数(好吧,对于随机数据,它没有多大意义......但无论如何)仅在某些时期。也就是说,仅在“春季”或“冬季”期间的相关性是什么?在哪里可以将春季和冬季定义为自定义时期?基本上,我只想“掩盖”感兴趣的季节之外的时期。

4

1 回答 1

1

您可以通过 获取索引的月份df.index.month,然后使用np.in1d选择您想要的内容:

df[np.in1d(df.index.month, [1, 2, 3, 10, 11, 12])]
于 2013-05-31T09:32:28.633 回答