我试图根据最新状态找出(猜测)当前状态。
假设我们有以下数据框(它是真实数据的缩写)
examineData
ID Date Status_Value
A 2012-01-01 100
A 2012-01-10 200
A 2012-02-20 500
B 2012-01-01 1100
B 2012-01-10 1200
B 2012-02-20 1500
C 2012-01-01 2100
C 2012-01-10 2200
C 2012-02-20 2500
在上面,A、B 和 C 是具有 status_value 的对象。在日期检查了 Status_values。
asked
ID Date
A 2012-01-09
A 2012-02-28
B 2012-02-19
C 2012-01-10
但是,有人在特定日期询问了 A、B 和 C 的状态(可能会更少)。
如您所见,其中一些asked$Date
与examinData$Date
.
在这种情况下,我们决定从examineData$Date
.
ID Date Status_Value
A 2012-01-09 100
A 2012-02-28 500
B 2012-02-19 1200
C 2012-01-10 2200
你能给我一个示例代码吗?(速度很重要 - 1,600,000 行examineData
,110,000 行asked
)
此外,还有超过60,000种ID。并且,examineData 中的同一个 ID 中没有重复的日期