2

我正在尝试使用 MASS 库中包含的画家数据集来拟合分类逻辑模型。

我将数据集分为两部分,因此我可以在未来使用基线类别逻辑多项式模型预测学校变量的值,以评估分类响应学校与连续解释变量之间的关系。不幸的是,我的代码在没有尝试预测的情况下运行或出错。

library(MASS)
set.seed(43)
painters_new<-painters[sample(nrow(painters)) , ] #randomizing rows
painters_pred<-painters_new[50:54,]
painters_new<-painters_new[1:49,]
model<-function(){
  #likelihood
  for( i in 1:N){
    y[i] ~ dcat(p[i,])
    #formulating probabilities
    p[i,1]<-ebx[i,1]/ebxsum[i]
    p[i,2]<-ebx[i,2]/ebxsum[i]
    p[i,3]<-ebx[i,3]/ebxsum[i]
    p[i,4]<-ebx[i,4]/ebxsum[i]
    p[i,5]<-ebx[i,5]/ebxsum[i]
    p[i,6]<-ebx[i,6]/ebxsum[i]
    p[i,7]<-ebx[i,7]/ebxsum[i]
    p[i,8]<-ebx[i,8]/ebxsum[i]
    #formulating denominator of probabilities
    ebxsum[i]<-ebx[i,1]+ebx[i,2]+ebx[i,3]+ebx[i,4]+ebx[i,5]+ebx[i,6]+ebx[i,7]+ebx[i,8]
    #formulating numerator of probabilities
    ebx[i,1]<-exp(beta0[1]+beta1[1]*composition[i]+beta2[1]*drawing[i]+beta3[1]*colour[i]+beta4[1]*expression[i])
    ebx[i,2]<-exp(beta0[2]+beta1[2]*composition[i]+beta2[2]*drawing[i]+beta3[2]*colour[i]+beta4[2]*expression[i])
    ebx[i,3]<-exp(beta0[3]+beta1[3]*composition[i]+beta2[3]*drawing[i]+beta3[3]*colour[i]+beta4[3]*expression[i])  
    ebx[i,4]<-1 #baseline is Category 4
    ebx[i,5]<-exp(beta0[5]+beta1[5]*composition[i]+beta2[5]*drawing[i]+beta3[5]*colour[i]+beta4[5]*expression[i])
    ebx[i,6]<-exp(beta0[6]+beta1[6]*composition[i]+beta2[6]*drawing[i]+beta3[6]*colour[i]+beta4[6]*expression[i])
    ebx[i,7]<-exp(beta0[7]+beta1[7]*composition[i]+beta2[7]*drawing[i]+beta3[7]*colour[i]+beta4[7]*expression[i])
    ebx[i,8]<-exp(beta0[8]+beta1[8]*composition[i]+beta2[8]*drawing[i]+beta3[8]*colour[i]+beta4[8]*expression[i])
    }
  #priors
    beta0[1:3]~dnorm(0,1.0E-06)
    beta1[1:3]~dnorm(0,1.0E-06)
    beta2[1:3]~dnorm(0,1.0E-06)
    beta3[1:3]~dnorm(0,1.0E-06)
    beta4[1:3]~dnorm(0,1.0E-06)
    beta0[4]<-0
    beta1[4]<-0
    beta2[4]<-0
    beta3[4]<-0
    beta4[4]<-0
    beta0[5:8]~dnorm(0,1.0E-06)
    beta1[5:8]~dnorm(0,1.0E-06)
    beta2[5:8]~dnorm(0,1.0E-06)
    beta3[5:8]~dnorm(0,1.0E-06)
    beta4[5:8]~dnorm(0,1.0E-06)
    
  
  }
library(R2OpenBUGS) 
model.file <- file.path(tempdir(),"model1.txt") 
write.model(model, model.file)
y<-as.numeric(painters_new$School)
N<-49
composition<-painters$Composition
drawing<-painters$Drawing
colour<-painters$Colour
expression<-painters$Expression
data<-list("y","N","composition","drawing","colour","expression")
params<-c('beta0','beta1','beta2','beta3','beta4')
inits<-function(){list( beta0=rep(0,8),beta1=rep(0,8),beta2=rep(0,8),beta3=rep(0,8),beta4=rep(0,8))}
out<-bugs(data,inits,params,model.file,n.chains = 3
          ,n.iter=6000,codaPkg = TRUE,n.burnin = 1000)

打开 log.txt 文件,我收到以下错误消息:

模型在语法上是正确的

数据加载

预期的多元节点

显然,这对应于数据结构错误'我使用的某些变量预计具有不同的维度。虽然我尝试了不同的方法来定义我使用的实体,但我完全确信,根据理论,包含的节点具有正确的形式。BUGS 是否有可能无法与分类一起使用并希望我通过 1 次迭代将其扩展到多项式?

有任何想法吗?


经过各种试验和修改,问题的根源似乎是我试图定义 beta-priors 的方式。BUGS 不支持 R 的常用数组技巧。我尝试了一些 if 语句来运球,我发现 BUGS 语言中 if 语句的常用方式(lol?)是使用 BUGS 的 2 个函数 equals(x,z)和步骤()。所以我做了关于他们的功课并重新安排了整个

thing. model<-function(){
  #likelihood
  for( i in 1:N){
    y[i] ~ dcat(p[i,])
    #formulating probabilities
    p[i,1]<-ebx[i,1]/ebxsum[i]
    p[i,2]<-ebx[i,2]/ebxsum[i]
    p[i,3]<-ebx[i,3]/ebxsum[i]
    p[i,4]<-ebx[i,4]/ebxsum[i]
    p[i,5]<-ebx[i,5]/ebxsum[i]
    p[i,6]<-ebx[i,6]/ebxsum[i]
    p[i,7]<-ebx[i,7]/ebxsum[i]
    p[i,8]<-ebx[i,8]/ebxsum[i]
    #formulating denominator of probabilities
    ebxsum[i]<-ebx[i,1]+ebx[i,2]+ebx[i,3]+ebx[i,4]+ebx[i,5]+ebx[i,6]+ebx[i,7]+ebx[i,8]
    #formulating numerator of probabilities
    ebx[i,1]<-exp(beta0[1]+beta1[1]*composition[i]+beta2[1]*drawing[i]+beta3[1]*colour[i]+beta4[1]*expression[i])
    ebx[i,2]<-exp(beta0[2]+beta1[2]*composition[i]+beta2[2]*drawing[i]+beta3[2]*colour[i]+beta4[2]*expression[i])
    ebx[i,3]<-exp(beta0[3]+beta1[3]*composition[i]+beta2[3]*drawing[i]+beta3[3]*colour[i]+beta4[3]*expression[i])  
    ebx[i,4]<-1 #baseline is Category 4
    ebx[i,5]<-exp(beta0[5]+beta1[5]*composition[i]+beta2[5]*drawing[i]+beta3[5]*colour[i]+beta4[5]*expression[i])
    ebx[i,6]<-exp(beta0[6]+beta1[6]*composition[i]+beta2[6]*drawing[i]+beta3[6]*colour[i]+beta4[6]*expression[i])
    ebx[i,7]<-exp(beta0[7]+beta1[7]*composition[i]+beta2[7]*drawing[i]+beta3[7]*colour[i]+beta4[7]*expression[i])
    ebx[i,8]<-exp(beta0[8]+beta1[8]*composition[i]+beta2[8]*drawing[i]+beta3[8]*colour[i]+beta4[8]*expression[i])
    }
  #priors construction step-like
  #f functions
  for(j in 1:8){
  f_branch[j,1]~dnorm(0,1.0E-6)
  f_branch[j,2]<-0
  #decision
  if_branch[j]<-1+equals(j,4)
  beta0[j]<-f_branch[j,if_branch[j]]
  beta1[j]<-f_branch[j,if_branch[j]]
  beta2[j]<-f_branch[j,if_branch[j]]
  beta3[j]<-f_branch[j,if_branch[j]]
  beta4[j]<-f_branch[j,if_branch[j]]
  }}
library(R2OpenBUGS) 
model.file <- file.path(tempdir(),"cat_log.txt") 
write.model(model, model.file)
y<-as.numeric(painters_new$School)
N<-49
composition<-painters$Composition
drawing<-painters$Drawing
colour<-painters$Colour
expression<-painters$Expression
data<-list("y","N","composition","drawing","colour","expression")
params<-c('beta0','beta1','beta2','beta3','beta4')
out<-bugs(data,inits=NULL,params,model.file,n.chains = 3
          ,n.iter=6000,codaPkg = TRUE,n.burnin = 1000)
 

所以现在在运球下一组错误之后,我在 R 中得到一个错误,而 log.txt 文件没有给我错误类型的指示。

model is syntactically correct
data loaded
model compiled

有任何想法吗?

4

0 回答 0