python - 在 pandas 中使用可变变化分割时间序列

Question

我正在那里（http://db.tt/9SG85XFK）绘制一个熊猫数据框；具有两个变量的“时间戳”索引（绘制为蓝色和绿色曲线）。

我想提取该数据帧的子集，其中蓝色曲线变量或多或少是恒定的（std.variation 低于特定值？）。

因此，对于附图，它将提取 3 个不同的子集 ~（41000:41170、41180:41315 和 41320:41580）。

有没有一种干净的方法可以做到这一点？我可以通过一个循环来做到这一点，但是......不确定这是正确的方式。

谢谢，

ñ

score 1 · Accepted Answer

您可能需要该功能的rolling_std功能。

指定要检查标准差的区间宽度（比如 100 个数据点），选择适当的标准差（比如 10）并执行以下操作：

 import pandas as pd
 s = pd.Series(the way you get your data)
 std = pd.rolling_std(s, 100)
 selected = s[std < 10]

您将在 100 个数据点周围获得标准差小于 10 的所有数据点。

1 回答 1