我正在那里(http://db.tt/9SG85XFK)绘制一个熊猫数据框;具有两个变量的“时间戳”索引(绘制为蓝色和绿色曲线)。
我想提取该数据帧的子集,其中蓝色曲线变量或多或少是恒定的(std.variation 低于特定值?)。
因此,对于附图,它将提取 3 个不同的子集 ~(41000:41170、41180:41315 和 41320:41580)。
有没有一种干净的方法可以做到这一点?我可以通过一个循环来做到这一点,但是......不确定这是正确的方式。
谢谢,
ñ
我正在那里(http://db.tt/9SG85XFK)绘制一个熊猫数据框;具有两个变量的“时间戳”索引(绘制为蓝色和绿色曲线)。
我想提取该数据帧的子集,其中蓝色曲线变量或多或少是恒定的(std.variation 低于特定值?)。
因此,对于附图,它将提取 3 个不同的子集 ~(41000:41170、41180:41315 和 41320:41580)。
有没有一种干净的方法可以做到这一点?我可以通过一个循环来做到这一点,但是......不确定这是正确的方式。
谢谢,
ñ
您可能需要该功能的rolling_std
功能。
指定要检查标准差的区间宽度(比如 100 个数据点),选择适当的标准差(比如 10)并执行以下操作:
import pandas as pd
s = pd.Series(the way you get your data)
std = pd.rolling_std(s, 100)
selected = s[std < 10]
您将在 100 个数据点周围获得标准差小于 10 的所有数据点。