2

我有一个关于功能ordinalR或具体功能的问题predict.clm()。我想计算linear predictor一个ordered probit估计值。使用 MASS 包的 polr 函数,可以通过 object$lp 访问线性预测器。它为我提供了每条线的价值,并且与我所理解的线性预测器即 X_i'beta 一致。但是,如果我使用predict.clm(object, newdata,"linear.predictor")带有 clm() 的有序概率估计,我会得到一个包含元素 eta1 和 eta2 的列表,

  1. 如果 newdata 包含因变量,则每列一列
  2. 如果 newdata 不包含因变量,则每个元素包含与因变量中的级别一样多的列

不幸的是,我不知道这意味着什么。同样在作者的文档和论文中,我没有找到任何关于它的信息。你们中的一个人会很好地启发我吗?这会很棒。

干杯,

AK

4

1 回答 1

3

更新(评论后):

基本clm模型是这样定义的(详见clm 教程):

生成数据:

library(ordinal)
set.seed(1)
test.data = data.frame(y=gl(4,5),
                       x=matrix(c(sample(1:4,20,T)+rnorm(20), rnorm(20)), ncol=2))
head(test.data) # two independent variables 
test.data$y     # four levels in y

构建模型:

fm.polr <- polr(y ~ x) # using polr
fm.clm  <- clm(y ~ x)  # using clm

现在我们可以访问thetasand betas(见上面的公式):

# Thetas
fm.polr$zeta # using polr
fm.clm$alpha # using clm
# Betas
fm.polr$coefficients # using polr
fm.clm$beta          # using clm

获得线性预测变量(仅theta公式右侧没有的部分):

fm.polr$lp                                                 # using polr
apply(test.data[,2:3], 1, function(x) sum(fm.clm$beta*x))  # using clm

新数据生成:

# Contains only independent variables
new.data <- data.frame(x=matrix(c(rnorm(10)+sample(1:4,10,T), rnorm(10)), ncol=2))
new.data[1,] <- c(0,0)  # intentionally for demonstration purpose
new.data

有四种类型的预测可用于clm模型。我们对 感兴趣type=linear.prediction,它返回一个包含两个矩阵的列表:eta1eta2。它们包含每个观测值的线性预测变量new.data

lp.clm <- predict(fm.clm, new.data, type="linear.predictor")
lp.clm

注 1: eta1eta2字面上相等。第二个只是在索引中旋转eta11 。j因此,它们分别打开了线性预测量表的左侧和右侧。

all.equal(lp.clm$eta1[,1:3], lp.clm$eta2[,2:4], check.attributes=FALSE)
# [1] TRUE

注2:第一行的预测new.data等于thetas(只要我们将此行设置为零)。

all.equal(lp.clm$eta1[1,1:3], fm.clm$alpha, check.attributes=FALSE)
# [1] TRUE

注 3:我们可以手动构建这样的预测。例如,第二行的预测new.data

second.line <- fm.clm$alpha - sum(fm.clm$beta*new.data[2,])
all.equal(lp.clm$eta1[2,1:3], second.line, check.attributes=FALSE)
# [1] TRUE

注 4:如果new.data包含响应变量,则predict仅返回指定水平的线性预测变量y。我们可以再次手动检查它:

new.data$y <- gl(4,3,length=10)
lp.clm.y <- predict(fm.clm, new.data, type="linear.predictor")
lp.clm.y

lp.manual <- sapply(1:10, function(i) lp.clm$eta1[i,new.data$y[i]])
all.equal(lp.clm.y$eta1, lp.manual)
# [1] TRUE
于 2013-01-24T13:03:52.060 回答