java - R - lm 和 r 平方

Question

我一直在处理这个网站和其他网站上的问题，我只是想确保我理解我的做法是正确的，然后我需要一些建议来分析结果。

我将 n 个二进制矩阵从 Java 导出到 R（使用 jri），然后我想针对预期的 0 向量运行 lm()。

这是将矩阵导入 R 的导出函数

REXP x = re.eval("selectionArray <- c()");

for (int j = 0; j < currentSelection.length; j++){
    boolean result = re.assign("currentSNPs", currentSelection[j]);
        if (result == true){
             x = re.eval("selectionArray <- rbind(selectionArray, currentSNPs)");
        }
}

那么我想执行 lm() 函数来获取 r 平方值

            x = re.eval("fm = lm(selectionArray ~ 0)");

我知道此时我需要使用 summary(fm) 来获取 r 平方值，但我不确定如何将它们拉出来或它们在这一点上的含义。我想知道每列与预期 0 值的偏差的重要性。

谢谢！

score 2 · Accepted Answer

从名为“m”的“lm”对象中提取 R^2 值

summary(m)$r.squared

您始终可以使用该str()函数查看 R 中对象的结构；在这种情况下你想要str(summary(m))

但是，尚不清楚您要在这里完成什么。lm()在您指定的函数的公式参数中selectionArray ~ 0，这没有意义有两个原因：1）如前所述，公式右侧的 0 对应于一个模型，其中您的预测变量是一个零向量和无法定义与该预测变量对应的 beta 系数。2) 你的结果 selectionArray 是一个矩阵。据我所知，lm()没有设置为具有多个结果。

您是否尝试测试 selectionArray 的每一列与 0 不同的重要性？如果是这样，任何至少有一次成功 (1) 的列都与 0 列显着不同。如果您对每列中成功概率的置信区间感兴趣，请使用以下代码。请注意，这不会针对多重比较进行调整。

首先让我们从一个玩具示例开始来演示这个概念

v1 <- rbinom(100,size=1,p=.25)  
#create a vector, length 100, 
#where each entry corresponds to the 
#result of a bernoulli trial with probability p

binom.test(sum(v1), n=length(v1), p = 0)
##let's pretend we didn't just generate v1 ourselves, 
##we can use binom.test to determine the 95% CI for p

#now in terms of what you want to do...
#here's a dataset that might be something like yours:
selectionArray <- sapply(runif(10), FUN=function(.p) rbinom(100,size=1,p=.p))
#I'm just generating 10 vectors from a binomial distribution 
#where each entry corresponds to 1 trial and each column 
#has a randomly generated p between 0 and 1

#using a for loop
#run a binomial test on each column, store the results in binom.test.results
binom.test.results <- list()
for(i in 1:ncol(selectionArray)){
    binom.test.results[[i]] <- binom.test(sum(selectionArray[,i]), 
        n=nrow(selectionArray), p=0)
}

#for loops are considered bad programming in r, so here's the "right" way to do it:
binom.test.results1 <- lapply(as.data.frame(selectionArray), function(.v){
    binom.test(sum(.v), n=nrow(selectionArray), p = 0)
})

#using str() on a single element of binom.test.result will help you 
#identify what results you'd like to extract from each test

score 0 · Accepted Answer

我对Java不太了解，所以我不谈论这个。

那么，你有一个 0 和 1 值的矩阵，没有其他二进制数？

并且您想知道列的均值是否有效。不同于0？

这意味着，您应该进行假设检验，而不一定要进行回归。然而，回归可以等同于这样的测试。

lm(y~0)没有意义。如果你只想要一个拦截，你应该使用lm(y~1). 但是，这相当于 t 检验，这在统计上是不正确的。

我怀疑使用fit<-glm(y~1,family=binomial)and 比提取 p-value更好p<-summary(fit)$coef[4]，但我不是统计学家。

java - R - lm 和 r 平方

2 回答 2

Related

Reference