我有一个带有一堆不同测量值的数据框(每个测量值在一measurements
列中都有一个唯一的 ID),并且每 10 毫秒采集一次测量样本。
现在我想对所有数据进行下采样,以便为所有测量“伪造”不同的采样时间,例如 40 毫秒。
我实现了重采样,如下所示,但现在我被困住了:我不想.mean()
在重采样器对象上执行聚合,因为这将处理来自相应 40 毫秒 bin 中所有样本的信息。
df.set_index('timedelta', inplace=True)
df.index = pd.to_timedelta(df.index, unit='S')
df= df_resampled.groupby('measurement').resample('40ms')
相反,我只想取重新采样的 40 毫秒 bin 中的第一个值并保持它 - 基本上,只需每 40 毫秒选择一次最新的给定值。
有没有一种优雅的方式来做到这一点?
编辑:找到了。只是被忽略.first()
为实现我在文档中想要的内置方式:https ://pandas.pydata.org/pandas-docs/version/0.25.1/reference/resampling.html#