0

我想计算 V2 与 V3、V4、...、V18 的相关性:即 cor(V2,V3, na.rm = TRUE), cor(V2, V4, na.rm =TRUE) 等最有效的方法是什么?

            V1    V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 V17 V18
1 141_21311223 2.000  1  0  0  0  0  0  0   0   0   0   0   0   0   0   0   0
2  44_33331123 2.000  0  0  0  0  0  0  0   0   0   0   0   0   0   0   0   0
3 247_11131211 2.065  0  0  0  0  0  0  0   0   0   0   0   0   0   0   0   0
4  33_31122113 2.080  0  0  0  0  0  0  0   0   0   0   0   0   0   0   0   0
5 277_21212111 2.090  0  0  0  0  0  1  1   1   1   0   0   0   0   0   0   0
4

1 回答 1

2

将我的评论转换为答案,一种简单的方法是在sapply语句中使用列位置:

sapply(3:ncol(mydf), function(y) cor(mydf[, 2], mydf[, y], ))

这应该创建一个输出值的向量。如果您更喜欢 a作为输出,请更改sapply为。lapplylist

虽然我从来没有na.rm见过cor......

于 2013-11-12T10:47:34.507 回答