我一直在尝试使用 R 作为 MVSP 的替代品进行聚类分析和 PCA。但是,R 使用我发现的所有函数(包括 dist、bcdist、hclust 和 daisy 函数)给出了与 MVSP 截然不同的输出。我还使用了 MVSP 的距离表输出作为 R 中的距离矩阵,它产生了进一步不同的输出。它需要使用欧几里得距离、索伦森骰子系数和平均/UPGMA 聚类的聚类/树状图。第二个人/输入以及我自己在多台计算机和两个版本上都重复了这些问题。SAS 给出了与 MVSP 相同的结果。
是否有另一个我可以使用的包(替代 dist 或 hclust)或在 R 中查看/测试算法的方法?有什么东西会导致这种情况,并且可以将 R 的版本回溯到更早的作品吗?
编辑; 发现了问题,我尝试的所有函数中使用的算法都没有使用 Sorenson 系数,所以我使用了 Proxy 包,带有 dist 函数(以及内置方法 =“Dice”)。