3

当我尝试在日期列上使用 apply() 条件来返回一组系数时,我收到一条错误消息。

我有一个数据集(为简单起见,此处进行了修改,但可重现):

ADataset <- data.table(Epoch = c("2007-11-15", "2007-11-16", "2007-11-17", 
                       "2007-11-18", "2007-11-19", "2007-11-20", "2007-11-21"),
                       Distance = c("92336.22", "92336.23", "92336.22", "92336.20",
                       "92336.19", "92336.21", "92336.18))
ADataset
        Epoch Distance
1: 2007-11-15 92336.22
2: 2007-11-16 92336.23
3: 2007-11-17 92336.22
4: 2007-11-18 92336.20
5: 2007-11-19 92336.19
6: 2007-11-20 92336.21
7: 2007-11-21 92336.18

分析从确定开始和结束日期开始:

############## Establish dates for analysis
#4.Set date for center of duration
StartDate <- "2007-11-18"
as.numeric(as.Date(StartDate)); StartDate
EndDate <- as.Date(tail(Adataset$Epoch,1)); EndDate

然后我建立分析的持续时间:

#5.Quantify duration of time window
STDuration <-  1
LTDuration  <- 3

然后我编写函数在两个持续时间上回归并返回斜率:

# Write STS and LTS functions, each with following steps
#6.Define time window- from StartDate less ShortTermDuration to 
StartDate plus ShortTermDuration
#7.Define Short Term & Long Term datasets
#8. Run regression over dataset
my_STS_Function <- function (StartDate) {

  STAhead  <- as.Date(StartDate) + STDuration; STAhead
  STBehind <- as.Date(StartDate) - STDuration; STBehind
  STDataset  <- subset(Adataset, as.Date(Epoch) >= STBehind & as.Date(Epoch)<STAhead)
  STResults <- rlm( Distance ~ Epoch, data=STDataset); STResults
  STSummary <- summary( STResults ); STSummary
  # Return coefficient (Slope of regression)
  STNum <- STResults$coefficients[2];STNum
}
my_LTS_Function <- function (StartDate) {
  LTAhead  <- as.Date(StartDate) + LTDuration; LTAhead
  LTBehind <- as.Date(StartDate) - LTDuration; LTBehind
  LTDataset  <- subset(Adataset, as.Date(Epoch) >= LTBehind & as.Date(Epoch)<LTAhead)
  LTResults <- rlm( Distance ~ Epoch, data=LTDataset); LTResults
  LTSummary <- summary( LTResults ); LTSummary
  # Return coefficient (Slope of regression)
  LTNum <- LTResults$coefficients[2];LTNum

然后我测试该函数以确保它适用于单个日期:

myTestResult <- my_STS_Function("2007-11-18")

它有效,因此我继续在数据集中的日期范围内应用该函数:

mySTSResult <- apply(Adataset, 1, my_STS_Function, seq(StartDate : EndDate))

...其中我想要的结果是 mySTSResult (斜率)的列表或数组或向量(以及随后的 myLTSResults 的单独列表/数组/向量,因此我可以在持续时间内创建 STSlope:LTSlope 比率),某事像(mySTSResults 捏造)...

> Adataset
    Epoch Distance mySTSResults
1: 2007-11-15 92336.22            3
2: 2007-11-16 92336.23            4
3: 2007-11-17 92336.22            5
4: 2007-11-18 92336.20            6
5: 2007-11-19 92336.19            7
6: 2007-11-20 92336.21            8
7: 2007-11-21 92336.18            9

只有我得到这个错误:

Error in FUN(newX[, i], ...) : unused argument(s) (1:1185)

这告诉我什么以及如何纠正它?我做了一些查找,找不到更正。

希望我已经充分解释了这一点。如果您需要更多详细信息,请告诉我。

4

2 回答 2

0

好的,似乎问题出 my_STS_Functionapply函数调用中所述的附加参数中(因为您只用一个参数定义了它)。日期范围作为附加参数传递给该函数,R 抱怨它未使用(看起来是 1185 个元素的向量)。您是否想先提取受日期范围限制的行的子集然后再应用my_STS_Function?我不得不考虑一个确切的解决方案。

对不起 - 我在那里的评论中做了我的锻炼。一个可能的解决方案是:

subSet <- Adataset[Adataset[,1] %in% seq(StartDate:EndDate),][order(na.exclude(match(Adataset[,1], seq(StartData,EndDate))),]

改编自这个问题的答案:

R从另一个向量中选择矩阵中的行(匹配,%in)

于 2013-08-13T23:00:59.277 回答
0

将此添加为新答案,因为前一个答案令人困惑。以前的评论者是正确的,您的代码中有错误,但它们不是症结所在。

我更新的方法是使用 seq.Date 生成日期序列(仅当您在开始和结束之间的每一天都有一个数据点时才有效 - 尽管您可以使用 na.exclude 如上所述):

dates = seq.Date(as.Date(StartDate),as.Date(EndDate),"days")

然后,您将其用作应用的输入,并使用一些类型来使事情正常工作(我已经使用 lamda 函数完成了此操作):

mySTSResult <- apply(as.matrix(dates), 1, function(x) {class(x) <- "Date"; my_STS_Function(x)})

然后希望您应该有一个结果向量,并且您应该能够为 LTS 做类似的事情,然后将其操作到原始数据框/矩阵中的另一列中。

于 2013-08-19T21:08:21.457 回答