我有一个具体问题;我有以下格式的数据:
# USER_ID SUBMISSION_DATE CONTRACT_REF
1 1 20/6 1:00 W001
2 1 20/6 2:00 W002
3 1 20/6 3:30 W003
4 4 20/6 4:00 W004
5 5 20/6 5:00 W005
6 5 20/6 6:00 W006
7 7 20/6 7:00 W007
8 7 20/6 8:00 W008
9 7 20/6 9:00 W009
10 7 20/6 10:00 W0010
现在我需要以某种方式计算不同提交之间的时间差(唯一可识别)。
换句话说:我有一个提交表,在这个表中,有所有用户的所有提交。我需要找到一种方法来计算每个唯一 STUDENT-CONTRACT 元组在nth assignment 和 (n-1)th assignment之间的时间差。
另请注意,每个新用户的新分配必须为零。所以输出将如下所示:
# USER_ID SUBMISSION_DATE CONTRACT_REF TIME_DIFFRENCE
1 1 20/6 1:00 W001 0
2 1 20/6 2:00 W002 3600
3 1 20/6 3:30 W003 5400
4 4 20/6 4:00 W004 3600
5 5 20/6 5:00 W005 0
6 5 20/6 6:00 W006 3600
7 7 20/6 7:00 W007 0
8 7 20/6 8:00 W008 3600
9 7 20/6 9:00 W009 3600
10 7 20/6 10:00 W0010 3600
请注意,时间可能不是以秒为单位,而是任何合适的时间。
我的想法:1)我认为这将需要 as.POSIXct 某处,以便 R 知道如何处理时间 2)这可能涉及一些包,例如plyr
,但我完全迷失在文档中,示例很难找到。
非常感谢您的所有回复!
最好的,雅库布