问题标签 [factoextra]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 转换为对数刻度时的警告,产生了很多 NaN
几周以来,我使用以下脚本生成了一个散点图,其中包含大约 10,000 个(非零,正)数据点。由于转换的警告,只有少数 (<20) 个数据点未包括在内。
从这周开始,我想做一些基于模型的聚类。我编写的脚本(见下文)使用相同的数据集(10,000 个非零的正数据点),但由于以下原因而遗漏了 9,000 多个数据点:
这是第二个脚本:
编辑
一些附加信息:
数据集仅包含大于 0 的值。 Head(dots.Mclust) 提供以下内容:
该图在移除 x 轴和 y 轴上的缩放比例后,如下所示。显然,数据点出了问题。数据集中没有负值,但仍有(很多)点低于 0。此外,x 轴和 y 轴不覆盖条目 [12,] 中的值。这可能是问题的根本原因。但是这个错误值的问题是如何发生的呢?
这里的根本问题是什么?
r - 直接从 CLARA 绘图结果解释 PCA 轴 Dim1 和 Dim2
我有一个包含超过 300,000 行/观察值和 22 个变量的大型数据集。我使用 CLARA 方法进行聚类,并使用 fviz_cluster 绘制结果。使用剪影方法,我得到了 10 作为我的集群数量,然后我将它应用于我的 CLARA 算法。
对于情节:
我认为这个聚类图是基于 PCA 的,并且一直试图找出我的原始数据中的哪些变量被选为 Dim1 和 Dim2 或者这些 x 和 y 轴代表什么。有人可以帮我找出这些 Dim1 和 Dim2 以及在不单独运行 PCA 的情况下存在的整个 Dim 的特征值/方差吗? 我看到还有一些其他的 PCA 函数/包,例如 factoextra 和 FactomineR 中的 get_eigenvalue,但似乎需要我从一开始就使用 PCA 算法?如何将它直接与我的 CLARA 结果集成?
另外,我的 Dim1 只包含 12.3% 和 Dim2 8.8%,这是否意味着这些变量不够具有代表性?考虑到我总共有 22 个维度(来自我的 22 个变量),我认为没关系,不是吗?我不确定 Dim1 和 Dim2 的这些百分比如何影响我的集群结果。我想从我的 CLARA 结果中做 screeplot,但我也想不通。
我会很感激任何见解。