我想找到自第一次观察到事件以来经过的时间。为此,我将每个观察结果保存在 CSV 文件中。每个事件都由唯一的哈希标识。
现在我正在做以下事情:
from pandas import *
from bz2 import BZ2File
events = DataFrame.from_csv(BZ2File('events.csv.bz2', 'r'), sep='\t', header=0, index_col=None)
m = events.groupby('hash')['timestamp'].min()
此时我有一个由哈希和第一次观察的时间戳索引的系列。我将如何使用它来获取事件 DataFrame 中每一行的时间偏移量(简单的时间戳 - 分钟(时间戳))?