我有一些及时测量的事件数据,所以数据格式看起来像
Time(s) Pressure Humidity
0 10 5
0 9.9 5.1
0 10.1 5
1 10 4.9
2 11 6
这里的第一列是自实验开始以来经过的时间,以秒为单位。其他两列是一些观察。当某些条件为真时会创建一行,这些条件超出了这里讨论的范围。用分号分隔的每组 3 个数字是一行数据。由于这里的最低时间分辨率只有几秒钟,因此您可以有两行具有相同的时间戳,但会有不同的观察结果。基本上这是两个不同的事件,时间无法区分。
现在我的问题是通过每 10 秒或 100 秒或 1000 秒对其进行二次抽样来汇总数据系列。所以我想要一个从原始更高粒度数据系列中提取的数据系列。有几种方法可以决定您将使用哪一行,例如,假设您每 10 秒进行一次二次采样,当 10 秒过去时,您可能会有多行,时间戳为 10 秒。你可以采取
1) first row
2) mean of all rows with the same timestamp of 10
3) some other technique
我希望在熊猫中做到这一点,任何想法或开始的方式将不胜感激。谢谢。