1

我正在使用 metaNMDS 来探索我正在使用的多元数据集。我已经通过一个有 6 个级别的感兴趣因素来限制数据集。排序是在布雷柯蒂斯相异矩阵上运行的,没有被自动转换,有 2 个维度(或轴),并且设置为最多运行 300 次迭代。椭圆基于 95% 的置信度并使用 SE。

NMDS 在大约 10-15 次迭代中求解,并且应力值差(15-18)还可以。当我用 ordiellipse 绘制数据以可视化哪些水平可能不同时,我惊讶于置信椭圆内实际上有多少数据。有人可以解释一下吗?这是否只是排序的产物,不能很好地拟合数据?没有捕获二维数据集中固有的变化?

有什么想法吗?我的声誉还不够高,无法发布情节图片,但如果我遇到一些问题,我可以发送一张。

4

1 回答 1

3

您正在为平均值(组质心)绘制一个置信椭圆,它告诉您如果您多次重复数据收集,您可能会看到平均值(质心)的采样分布。换句话说,您正在查看给定您收集的数据样本的总体均值(质心)估计值的不确定性。

另一种类型的置信椭圆基于标准偏差。这是对数据分布的度量(不是平均值),因此如果您切换到该类型,则置信椭圆的覆盖率应该不会那么令人惊讶。

请注意,这与人们在讨论描述性统计中的标准差和均值的标准误差时所存在的误解相同。

于 2015-04-22T22:00:05.197 回答