5

我仍然是一个愚蠢的新手,所以如果这是一个简单的问题,请原谅我,但我在 stackoverflow 上找不到答案。我想为美国的每个主要假期创建一组指标变量,只需将一个函数应用于我的日期字段,该函数可以检测哪些天是假期,然后我可以使用 Model.matrix 等转换为一组的指标变量。
例如,我有从 2012 年 1 月 1 日到 2013 年 9 月 15 日的每日数据,我想为复活节创建一个可变指标。

我目前正在使用该timeDate包将一年传递给他们的函数Easter()来查找日期。然后,我将日期键入以下代码以创建指标变量。

Easter(2012)
EasterInd2012<-as.numeric(DATASET$Date=="2012-04-08")
4

1 回答 1

11

获取一般假期指示变量的最简单方法是创建一个包含您感兴趣的所有假期的向量,然后匹配数据框中的这些日期。像这样的东西应该工作:

library(timeDate)

# Sample data
Date <- seq(as.Date("2012-01-01"), as.Date("2013-09-15"), by="1 day")
DATASET <- data.frame(rnorm(624), Date)

# Vector of holidays
holidays <- c(as.Date("2012-01-01"), 
              as.Date(Easter(2013)),
              as.Date("2012-12-25"),
              as.Date("2012-12-31"))

# 1 if holiday, 0 if not. Could also be a factor, like c("Yes", "No")
DATASET$holiday <- ifelse(DATASET$Date %in% holidays, 1, 0)

您可以手动输入日期,也可以使用一些timeDate内置的假期功能(该listHolidays()功能显示所有这些)。所以你也可以holidays这样构造:

holidays <- c(as.Date("2012-01-01"), 
              as.Date(Easter(2013)),
              as.Date(USLaborDay(2012)),
              as.Date(USThanksgivingDay(2012)),
              as.Date(USMemorialDay(2012)),
              as.Date("2012-12-25"),
              as.Date("2012-12-31"))

要获得每个假期的具体指标,您需要一次完成一项:

EasterInd2012 <- ifelse(DATASET$Date==as.Date(Easter(2012)), 1, 0)
LaborDay2012 <- ifelse(DATASET$Date==as.Date(UsLaborDay(2012)), 1, 0)
# etc.
于 2013-10-02T14:23:24.743 回答