0

我有一个具有连接日期断开日期rowIDRouterName的数据框。我想在一个循环中找到当前活动的连接,该循环每分钟迭代一次(这可以更改为任何分钟),持续 24 小时。我正在尝试从该数据集计算该位置的人数,稍后我将使用该数据集来计算代理感染电晕或任何空气传播传染病的风险水平。我找不到使用 python pandas 从数据集中计算的方法。 在此处输入图像描述

4

1 回答 1

0

我要做几个假设:

  1. 每个设备 ID 都是唯一的,没有冲突

  2. 您只寻找当前连接的设备

  3. 已连接设备的 disconnect_at 为空

    active = df[df.disconnect_at < curr_timestamp] counts = active.groupby(“router_name”).agg({“device_id”:pd.Series.nunique})

像这样的东西应该工作

于 2021-05-30T12:39:58.810 回答