2

我有一个包含 id 和发布日期的数据框,对于每个数据框,我想知道每个发布日期在哪个日期范围 (Time_Seq) 中。

日期向量如下所示:

data:
    ID     LAUNCH_DATE
1 50314486  2004-01-01
2 55842774  2004-01-27

我有一个包含不同数据范围的时序数据框:

head(Time_Table):
  Time_Seq   DateFrom     DateTo
1      726 2003-12-29 2004-01-04
2      727 2004-01-05 2004-01-11
3      728 2004-01-12 2004-01-18
4      729 2004-01-19 2004-01-25
5      730 2004-01-26 2004-02-01
6      731 2004-02-02 2004-02-08

理想情况下,我希望输出看起来像:

    ID     LAUNCH_DATE   Time_Seq
1 50314486  2004-01-01      726
2 55842774  2004-01-27      731

目前,我可以通过以下方式以非常简单的方式解决一个日期:

Time_Table$Time_Seq[which( (date$LAUNCH_DATE[1]>=Time_Table$DATEFROM)&(date$LAUNCH_DATE[1]<=Time_Table$DATETO) )]

任何人都可以提出一种更简单的方法而不必以这种方式循环吗?

4

2 回答 2

2

我只是想玩一下interval%within%在 package 中lubridate

library(lubridate)

# create intervals
interval <- with(Time_Table, new_interval(ymd(DateFrom), ymd(DateTo)))

# for each LAUNCH_DATE, test whether it falls within an interval, and pick corresponding Time_Seq
data$Time_Seq <- sapply(data$LAUNCH_DATE, function(x) Time_Table$Time_Seq[ymd(x) %within% interval])
于 2013-09-05T14:36:24.940 回答
1

cut连续变量分成类别的功能适用于日期。

data$Time_Seq <- cut(
  data$LAUNCH_DATE, 
  c(Time_Table$DateFrom, Time_Table$DateTo[nrow(Time_Table)]), 
  labels = Time_Table$Time_Seq,
  right = FALSE
)
于 2013-09-05T10:05:59.077 回答