我正在处理生物数据——即基因组。例如:
group 1: geneA geneB geneC
group 2: geneD geneE
group 3: geneF geneG geneH
对于每对基因,geneX
我geneY
有一个分数来说明这两个基因有多相似(实际上,我有两个分数,因为我使用了“定向”的 BLAST:我首先搜索geneX
所有其他基因,然后搜索所有geneY
其他基因,所以我有两个geneX--geneY
分数,但我想我可以取两者中较低的分数,或者平均值)。
所以,假设我对每对基因只有一个分数。我的数据可以看成一个无向图:
并回忆每条边都有一个附加的分数。
现在,我想做的是:
以交互方式可视化我的数据:能够单击基因节点并打开附加到它们的链接,仅显示高于/低于某个阈值的边缘,控制网络如何“传播”等。
将相似的组聚集在一起,即具有相似基因的组。
关于我该怎么做的任何想法?我想这是基本的集群,我会很感激任何关于包/软件的提示,这些提示可以在这里提供任何帮助。
谢谢你。