我对 R 比较陌生,我目前正在开发一个应用程序,其中有一个如下所示的数据框:
数据库 用户 ID 小时日期 01 18 01.01.2016 01 18 01.01.2016 01 14 02.01.2016 01 14 02.01.2016 02 21 02.01.2016 02 08 05.01.2016 02 08 05.01.2016 03 23 05.01.2016
每行代表一个会话。
我需要确定用户第一次会话的时间是否会影响该用户将要进行的会话数。
我试过命令summaryBy
:
library(doBy)
first_hour <- summaryBy(UserId + Hour + Date ~ UserId,
FUN=c(head, length, unique), database)
但这并没有给我正确的结果。
我的目标是确定Hour
用户参加的第一个会话,确定用户有多少个会话和多少个不同的会话日期。
如果有人可以帮助解决这个问题,那将非常酷!