我拥有的数据集包含 1380 只对冲基金的月度回报,但大多数基金都缺少数据。我想将每只基金的每月回报回归到一些因素,如国债收益率 (TBY)。我尝试使用 for 循环将每个资金的每月回报回归到因子,但收到以下错误消息:
#Error in lm.fit(x, y, offset = offset, singular.ok = singular.ok, ...) :
# 0 (non-NA) cases
我在互联网上进行了一些搜索,并认为问题是由列表删除引起的。我转载了一个简单的案例来说明:
#create a dataframe A with 8 funds and two factors
A<-data.frame(fund1=rnorm(5),fund2=rnorm(5),fund3=rnorm(5),fund4=rnorm(5),
fund5=rnorm(5),fund6=rnorm(5),fund7=rnorm(5),fund8=rnorm(5),
SP500=rnorm(5),TBY=rnorm(5))
#replace some vlaue with NA
A[1,3:5]<-NA
A[2,1:2]<-NA
A[3,3]<-NA
A[4,2:4]<-NA
A[5,1]<-NA
A[1:5,7]<-NA
A
# build two data frames to split funds and factors
funds<-as.data.frame(A[,1:8])
factors<-as.data.frame(A[,9:10])
# build empty data frame to store regression outputs
results<-data.frame(matrix(NA,ncol=4,nrow=8))
colnames(results)<-c("estimates", "residual", "t", "p")
rownames(results)<-as.vector(colnames(funds))
for(i in 1:8){
fit<-lm(as.vector(funds[,i])~TBY,data=factors,na.action=na.omit)
results[i,1]<-coef(summary(fit))[1,1]
results[i,2]<-coef(summary(fit))[1,2]
results[i,3]<-coef(summary(fit))[1,3]
results[i,4]<-coef(summary(fit))[1,4]
}
results
最终结果如下所示:
results
# estimates residual t p
# fund1 0.1039720 0.2486456 0.4181535 0.7478621
# fund2 -0.1040939 0.2464246 -0.4224168 0.7455554
# fund3 0.3869647 NaN NaN NaN
# fund4 0.1349445 0.2107588 0.6402796 0.6374377
# fund5 0.7470140 0.4066014 1.8372147 0.2075786
# fund6 0.8305238 0.3845686 2.1596245 0.1196180
# fund7 NA NA NA NA
# fund8 NA NA NA NA
程序在fund7 处停止循环。我认为主要原因是 fund7 的列仅包含NA
s ,因此循环无法继续。谁能给我一些建议,让程序在这种情况下继续运行?我希望得到的结果是每个回归模型的常数。您的评论将不胜感激。
谢谢。