-2

我想写入有关相关性的数据文件信息,如下所示:

*korelacja=cor(p2,d2,method="pearson",use = "complete.obs")
korelacja2=cor(p2,d2,method="kendall",use = "complete.obs")
korelacja3=cor(p2,d2,method="spearman",use = "complete.obs")
dane=paste(korelacja,korelacja2,korelacja3,sep=';')
write(dane,file=nazwa,append=TRUE)*

结果对我来说很奇怪 - Pearson 相关性非常高(始终等于 1),但 Kendall 和 Spearman 非常低。我创建了散点图,但看不到线性相关性。

4

1 回答 1

1

如果您的数据中有一些大的异常值主导 Pearson 相关性但在非参数(Kendall/Spearman)方法中相对无关紧要,则复制这种模式并不难。例如,这里是一个编造的数据集,除了一个大的异常值之外什么都没有发生:

> set.seed(1001)
> x <- c(runif(1000),1e5)
> y <- c(runif(1000),1e5)
> cor(x,y,method="pearson")
[1] 1
> cor(x,y,method="kendall")
[1] -0.02216583
> cor(x,y,method="spearman")
[1] -0.03335352

到目前为止,这与您的描述一致,尽管在这种情况下您应该能够看到散点图中的异常值...

于 2011-08-26T16:01:24.883 回答