我正在尝试使用 MASS 库中包含的画家数据集来拟合分类逻辑模型。
我将数据集分为两部分,因此我可以在未来使用基线类别逻辑多项式模型预测学校变量的值,以评估分类响应学校与连续解释变量之间的关系。不幸的是,我的代码在没有尝试预测的情况下运行或出错。
library(MASS)
set.seed(43)
painters_new<-painters[sample(nrow(painters)) , ] #randomizing rows
painters_pred<-painters_new[50:54,]
painters_new<-painters_new[1:49,]
model<-function(){
#likelihood
for( i in 1:N){
y[i] ~ dcat(p[i,])
#formulating probabilities
p[i,1]<-ebx[i,1]/ebxsum[i]
p[i,2]<-ebx[i,2]/ebxsum[i]
p[i,3]<-ebx[i,3]/ebxsum[i]
p[i,4]<-ebx[i,4]/ebxsum[i]
p[i,5]<-ebx[i,5]/ebxsum[i]
p[i,6]<-ebx[i,6]/ebxsum[i]
p[i,7]<-ebx[i,7]/ebxsum[i]
p[i,8]<-ebx[i,8]/ebxsum[i]
#formulating denominator of probabilities
ebxsum[i]<-ebx[i,1]+ebx[i,2]+ebx[i,3]+ebx[i,4]+ebx[i,5]+ebx[i,6]+ebx[i,7]+ebx[i,8]
#formulating numerator of probabilities
ebx[i,1]<-exp(beta0[1]+beta1[1]*composition[i]+beta2[1]*drawing[i]+beta3[1]*colour[i]+beta4[1]*expression[i])
ebx[i,2]<-exp(beta0[2]+beta1[2]*composition[i]+beta2[2]*drawing[i]+beta3[2]*colour[i]+beta4[2]*expression[i])
ebx[i,3]<-exp(beta0[3]+beta1[3]*composition[i]+beta2[3]*drawing[i]+beta3[3]*colour[i]+beta4[3]*expression[i])
ebx[i,4]<-1 #baseline is Category 4
ebx[i,5]<-exp(beta0[5]+beta1[5]*composition[i]+beta2[5]*drawing[i]+beta3[5]*colour[i]+beta4[5]*expression[i])
ebx[i,6]<-exp(beta0[6]+beta1[6]*composition[i]+beta2[6]*drawing[i]+beta3[6]*colour[i]+beta4[6]*expression[i])
ebx[i,7]<-exp(beta0[7]+beta1[7]*composition[i]+beta2[7]*drawing[i]+beta3[7]*colour[i]+beta4[7]*expression[i])
ebx[i,8]<-exp(beta0[8]+beta1[8]*composition[i]+beta2[8]*drawing[i]+beta3[8]*colour[i]+beta4[8]*expression[i])
}
#priors
beta0[1:3]~dnorm(0,1.0E-06)
beta1[1:3]~dnorm(0,1.0E-06)
beta2[1:3]~dnorm(0,1.0E-06)
beta3[1:3]~dnorm(0,1.0E-06)
beta4[1:3]~dnorm(0,1.0E-06)
beta0[4]<-0
beta1[4]<-0
beta2[4]<-0
beta3[4]<-0
beta4[4]<-0
beta0[5:8]~dnorm(0,1.0E-06)
beta1[5:8]~dnorm(0,1.0E-06)
beta2[5:8]~dnorm(0,1.0E-06)
beta3[5:8]~dnorm(0,1.0E-06)
beta4[5:8]~dnorm(0,1.0E-06)
}
library(R2OpenBUGS)
model.file <- file.path(tempdir(),"model1.txt")
write.model(model, model.file)
y<-as.numeric(painters_new$School)
N<-49
composition<-painters$Composition
drawing<-painters$Drawing
colour<-painters$Colour
expression<-painters$Expression
data<-list("y","N","composition","drawing","colour","expression")
params<-c('beta0','beta1','beta2','beta3','beta4')
inits<-function(){list( beta0=rep(0,8),beta1=rep(0,8),beta2=rep(0,8),beta3=rep(0,8),beta4=rep(0,8))}
out<-bugs(data,inits,params,model.file,n.chains = 3
,n.iter=6000,codaPkg = TRUE,n.burnin = 1000)
打开 log.txt 文件,我收到以下错误消息:
模型在语法上是正确的
数据加载
预期的多元节点
显然,这对应于数据结构错误'我使用的某些变量预计具有不同的维度。虽然我尝试了不同的方法来定义我使用的实体,但我完全确信,根据理论,包含的节点具有正确的形式。BUGS 是否有可能无法与分类一起使用并希望我通过 1 次迭代将其扩展到多项式?
有任何想法吗?
经过各种试验和修改,问题的根源似乎是我试图定义 beta-priors 的方式。BUGS 不支持 R 的常用数组技巧。我尝试了一些 if 语句来运球,我发现 BUGS 语言中 if 语句的常用方式(lol?)是使用 BUGS 的 2 个函数 equals(x,z)和步骤()。所以我做了关于他们的功课并重新安排了整个
thing. model<-function(){
#likelihood
for( i in 1:N){
y[i] ~ dcat(p[i,])
#formulating probabilities
p[i,1]<-ebx[i,1]/ebxsum[i]
p[i,2]<-ebx[i,2]/ebxsum[i]
p[i,3]<-ebx[i,3]/ebxsum[i]
p[i,4]<-ebx[i,4]/ebxsum[i]
p[i,5]<-ebx[i,5]/ebxsum[i]
p[i,6]<-ebx[i,6]/ebxsum[i]
p[i,7]<-ebx[i,7]/ebxsum[i]
p[i,8]<-ebx[i,8]/ebxsum[i]
#formulating denominator of probabilities
ebxsum[i]<-ebx[i,1]+ebx[i,2]+ebx[i,3]+ebx[i,4]+ebx[i,5]+ebx[i,6]+ebx[i,7]+ebx[i,8]
#formulating numerator of probabilities
ebx[i,1]<-exp(beta0[1]+beta1[1]*composition[i]+beta2[1]*drawing[i]+beta3[1]*colour[i]+beta4[1]*expression[i])
ebx[i,2]<-exp(beta0[2]+beta1[2]*composition[i]+beta2[2]*drawing[i]+beta3[2]*colour[i]+beta4[2]*expression[i])
ebx[i,3]<-exp(beta0[3]+beta1[3]*composition[i]+beta2[3]*drawing[i]+beta3[3]*colour[i]+beta4[3]*expression[i])
ebx[i,4]<-1 #baseline is Category 4
ebx[i,5]<-exp(beta0[5]+beta1[5]*composition[i]+beta2[5]*drawing[i]+beta3[5]*colour[i]+beta4[5]*expression[i])
ebx[i,6]<-exp(beta0[6]+beta1[6]*composition[i]+beta2[6]*drawing[i]+beta3[6]*colour[i]+beta4[6]*expression[i])
ebx[i,7]<-exp(beta0[7]+beta1[7]*composition[i]+beta2[7]*drawing[i]+beta3[7]*colour[i]+beta4[7]*expression[i])
ebx[i,8]<-exp(beta0[8]+beta1[8]*composition[i]+beta2[8]*drawing[i]+beta3[8]*colour[i]+beta4[8]*expression[i])
}
#priors construction step-like
#f functions
for(j in 1:8){
f_branch[j,1]~dnorm(0,1.0E-6)
f_branch[j,2]<-0
#decision
if_branch[j]<-1+equals(j,4)
beta0[j]<-f_branch[j,if_branch[j]]
beta1[j]<-f_branch[j,if_branch[j]]
beta2[j]<-f_branch[j,if_branch[j]]
beta3[j]<-f_branch[j,if_branch[j]]
beta4[j]<-f_branch[j,if_branch[j]]
}}
library(R2OpenBUGS)
model.file <- file.path(tempdir(),"cat_log.txt")
write.model(model, model.file)
y<-as.numeric(painters_new$School)
N<-49
composition<-painters$Composition
drawing<-painters$Drawing
colour<-painters$Colour
expression<-painters$Expression
data<-list("y","N","composition","drawing","colour","expression")
params<-c('beta0','beta1','beta2','beta3','beta4')
out<-bugs(data,inits=NULL,params,model.file,n.chains = 3
,n.iter=6000,codaPkg = TRUE,n.burnin = 1000)
所以现在在运球下一组错误之后,我在 R 中得到一个错误,而 log.txt 文件没有给我错误类型的指示。
model is syntactically correct
data loaded
model compiled
有任何想法吗?