0

我正在处理生物数据——即基因组。例如:

group 1: geneA geneB geneC
group 2: geneD geneE
group 3: geneF geneG geneH

对于每对基因,geneXgeneY有一个分数来说明这两个基因有多相似(实际上,我有两个分数,因为我使用了“定向”的 BLAST:我首先搜索geneX所有其他基因,然后搜索所有geneY其他基因,所以我有两个geneX--geneY分数,但我想我可以取两者中较低的分数,或者平均值)。

所以,假设我对每对基因只有一个分数。我的数据可以看成一个无向图: 替代文字

并回忆每条边都有一个附加的分数。

现在,我想做的是:

  1. 以交互方式可视化我的数据:能够单击基因节点并打开附加到它们的链接,仅显示高于/低于某个阈值的边缘,控制网络如何“传播”等。

  2. 将相似的组聚集在一起,即具有相似基因的组。

关于我该怎么做的任何想法?我想这是基本的集群,我会很感激任何关于包/软件的提示,这些提示可以在这里提供任何帮助。

谢谢你。

4

2 回答 2

1

如果您在BioStar(生物信息学堆栈交换中心)提出这个问题,您可能会得到更好的答复。具体来说,这个线程中的许多答案可能是相关的:

哪个是在有向图(网络)中表示生物途径的最佳软件?

于 2010-09-13T13:18:00.300 回答
0

你可以试试cluto。您必须将三元组(gene_1、gene_2、similarity)转换为矩阵并使用“集群”。

于 2010-09-13T08:30:01.973 回答