0

我正在那里(http://db.tt/9SG85XFK)绘制一个熊猫数据框;具有两个变量的“时间戳”索引(绘制为蓝色和绿色曲线)。

我想提取该数据帧的子集,其中蓝色曲线变量或多或少是恒定的(std.variation 低于特定值?)。

因此,对于附图,它将提取 3 个不同的子集 ~(41000:41170、41180:41315 和 41320:41580)。

有没有一种干净的方法可以做到这一点?我可以通过一个循环来做到这一点,但是......不确定这是正确的方式。

谢谢,

ñ

4

1 回答 1

1

您可能需要该功能的rolling_std功能。

指定要检查标准差的区间宽度(比如 100 个数据点),选择适当的标准差(比如 10)并执行以下操作:

 import pandas as pd
 s = pd.Series(the way you get your data)
 std = pd.rolling_std(s, 100)
 selected = s[std < 10]

您将在 100 个数据点周围获得标准差小于 10 的所有数据点。

于 2013-08-07T11:03:17.640 回答