我使用 cummeRbund 函数findSimilar()来找到与我使用 Cuffdiff 识别的差异表达基因最相似的 10 个基因。这使用了 Jensen-Shannon 距离并产生了一个排序的基因列表,我现在想测试它的 GO 富集。该文件如下所示:
"XLOC_007917" 0
"XLOC_008881" 0.00417099861122699
"XLOC_017692" 0.0178758082512721
"XLOC_008901" 0.0180682577435933
"XLOC_014267" 0.0333227735282459
"XLOC_013408" 0.0400392521794019
"XLOC_013497" 0.0412541820119971
"XLOC_010554" 0.0453928603025379
"XLOC_000570" 0.0461264880687295
"XLOC_010786" 0.0469577467848723
我首先手动搜索了每个最相似基因的 GO 术语,但我想做一个更可靠的分析。我正在尝试运行 Broad Institute 的 Java 应用程序 GSEA。
我制作了我的排名列表文件格式 (*.rnk),现在我必须选择一个基因集数据库。
我正在研究一种海绵物种,所以我不能使用已经提供的数据库。
如何创建自己的基因集数据库?它应该是什么样子?