python - 如何对具有零阶保持的分组数据帧进行重新采样？

翻译自：https://stackoverflow.com/questions/66754074 2021-03-22T21:27:00.927

112 次

我有一个带有一堆不同测量值的数据框（每个测量值在一measurements列中都有一个唯一的 ID），并且每 10 毫秒采集一次测量样本。

现在我想对所有数据进行下采样，以便为所有测量“伪造”不同的采样时间，例如 40 毫秒。

我实现了重采样，如下所示，但现在我被困住了：我不想.mean()在重采样器对象上执行聚合，因为这将处理来自相应 40 毫秒 bin 中所有样本的信息。

df.set_index('timedelta', inplace=True)
df.index = pd.to_timedelta(df.index, unit='S')
df= df_resampled.groupby('measurement').resample('40ms')

相反，我只想取重新采样的 40 毫秒 bin 中的第一个值并保持它 - 基本上，只需每 40 毫秒选择一次最新的给定值。

有没有一种优雅的方式来做到这一点？

编辑：找到了。只是被忽略.first()为实现我在文档中想要的内置方式：https ://pandas.pydata.org/pandas-docs/version/0.25.1/reference/resampling.html#

0 回答 0