cluster-analysis - 如何可视化基因网络和基因簇？

Question

我正在处理生物数据——即基因组。例如：

group 1: geneA geneB geneC
group 2: geneD geneE
group 3: geneF geneG geneH

对于每对基因，geneX我geneY有一个分数来说明这两个基因有多相似（实际上，我有两个分数，因为我使用了“定向”的 BLAST：我首先搜索geneX所有其他基因，然后搜索所有geneY其他基因，所以我有两个geneX--geneY分数，但我想我可以取两者中较低的分数，或者平均值）。

所以，假设我对每对基因只有一个分数。我的数据可以看成一个无向图：替代文字

并回忆每条边都有一个附加的分数。

现在，我想做的是：

以交互方式可视化我的数据：能够单击基因节点并打开附加到它们的链接，仅显示高于/低于某个阈值的边缘，控制网络如何“传播”等。
将相似的组聚集在一起，即具有相似基因的组。

关于我该怎么做的任何想法？我想这是基本的集群，我会很感激任何关于包/软件的提示，这些提示可以在这里提供任何帮助。

谢谢你。

score 1 · Accepted Answer

如果您在BioStar（生物信息学堆栈交换中心）提出这个问题，您可能会得到更好的答复。具体来说，这个线程中的许多答案可能是相关的：

哪个是在有向图（网络）中表示生物途径的最佳软件？

score 0 · Accepted Answer

你可以试试cluto。您必须将三元组（gene_1、gene_2、similarity）转换为矩阵并使用“集群”。

cluster-analysis - 如何可视化基因网络和基因簇？

2 回答 2

Related

Reference