我有一个如下所示的数据集(dat):
Person IPaddress
36598035 222.999.22.99
36598035 222.999.22.99
36598035 222.999.22.99
36598035 222.999.22.99
36598035 222.999.22.99
36598035 444.666.44.66
37811171 111.88.111.88
37811171 111.88.111.88
37811171 111.88.111.88
37811171 111.88.111.88
37811171 111.88.111.88
它反映了个人在一段时间内登录网站的实例。我需要数据看起来像这样:
Person IPaddress Number of Logins
36598035 222.999.22.99 6
37811171 111.88.111.88 5
因此,不是同一个人有多个条目,而是每个人只有一行,计算他们登录的次数。
此外,您会注意到在我的示例中,人 36598035 使用多个 IP 地址登录。发生这种情况时,我希望最终数据集中的 IP 地址反映模式 IP 地址——换句话说,个人最常登录的 IP 地址。