2

回到这个线程,我正在计算两个椭圆之间的交集,例如 versicolor 和 virginca 之间的交集的体积: 虹膜数据集上的 PCA 使用以下 mwe:

data(iris)
log.ir <- log(iris[, 1:4])
ir.species <- iris[, 5]
ir.pca <- prcomp(log.ir, center = TRUE, scale. = TRUE)

library(ggbiplot)
g <- ggbiplot(ir.pca, obs.scale = 1, var.scale = 1, 
          groups = ir.species, ellipse = TRUE,
          circle = TRUE)
g <- g + scale_color_discrete(name = '')
g <- g + theme(legend.direction = 'horizontal', 
           legend.position = 'top')
print(g)

然后我使用overlap{siar}计算椭圆体,如下所示:

library(siar)
setosa <- ir.pca$x[ir.species=="setosa",]
versicolor <- ir.pca$x[ir.species=="versicolor",]
virginica <- ir.pca$x[ir.species=="virginica",]

tmp <- overlap(versicolor[,1], versicolor[,2], virginica[,1], virginica[,2], steps = 5)
virginica.percentage <- round(x=(tmp$overlap/tmp$area2*100), digits = 2)
versicolor.percentage <- round(x=(tmp$overlap/tmp$area1*100), digits = 2)
> virginica.percentage [1] 1.54
> versicolor.percentage[1] 1.56

这显然比上面的图2所示的要少得多。

正如第50 行上的 ggbiplot 代码所示,ggbiplot 默认计算概率为“ellipse.prob = 0.68”的正态概率椭球,即上图中使用的。

由于文档重叠 {siar} 将椭圆计算为“小样本校正标准椭圆”。

因此,我问自己如何修改重叠 {siar} 以计算类似于在 ggbiplot 中绘制/计算的正态概率椭球。

4

1 回答 1

2

可从https://github.com/AndrewLJackson/SIBER获得的最新版本的 SIBER包括两个新函数来计算用户定义大小的椭圆的重叠(即不同的分位数)。

maxLikOverlap()

bayesianOverlap()

我建议您使用从主分支安装

  # install.packages("devtools") # install if necessary
  devtools::install_github("andrewljackson/SIBER@master",
  build_vingettes = TRUE)
  library(SIBER)

并按照小插图“Ellipse-Overlap”。如果没有为您安装小插图,您可以直接从 github 存储库下载它们https://github.com/AndrewLJackson/SIBER/tree/master/vignettes

于 2017-04-19T20:53:19.040 回答