我试图根据最新状态找出(猜测)当前状态。
假设我们有以下数据框(它是真实数据的缩写)
examineData
ID      Date            Status_Value
A       2012-01-01      100
A       2012-01-10      200
A       2012-02-20      500
B       2012-01-01      1100
B       2012-01-10      1200
B       2012-02-20      1500
C       2012-01-01      2100
C       2012-01-10      2200
C       2012-02-20      2500
在上面,A、B 和 C 是具有 status_value 的对象。在日期检查了 Status_values。
asked
ID      Date
A       2012-01-09
A       2012-02-28
B       2012-02-19
C       2012-01-10
但是,有人在特定日期询问了 A、B 和 C 的状态(可能会更少)。
如您所见,其中一些asked$Date与examinData$Date.
在这种情况下,我们决定从examineData$Date.
ID      Date            Status_Value
A       2012-01-09      100
A       2012-02-28      500
B       2012-02-19      1200
C       2012-01-10      2200
你能给我一个示例代码吗?(速度很重要 - 1,600,000 行examineData,110,000 行asked)
此外,还有超过60,000种ID。并且,examineData 中的同一个 ID 中没有重复的日期