2

我用来创建 umap 的主要参数是min_dist,ab. 我设置了min_dist=0.5, ,当使用所有特征(大约 10K 到 30K 特征)时a=1b=1它最初为大多数数据集提供了有意义的低维表示。但是当我通过特征选择方法减少数据的特征数量时(选​​择了 200-500 个特征),那么低维 umap 表示不再显示任何意义(例如 - 它变得非常稀疏和粘稠) .然后我必须不断调整参数以使 2D 可视化有意义。

有什么方法可以克服手动调整的必要性,并根据所选特征的数量来概括参数值?

PS - 我不是数学系的学生,对 umap 的工作原理有一个非常模糊的“理解”。我自己还没有实现算法。我在单细胞数据上使用 seurat 包的 RunUMAP 函数。

4

0 回答 0