我已经量化了 Salmon 的基因表达,它给了我 Ensembl 转录本,我将 Ensembl 转录本转换为基因符号,但对于某些基因,我有多个转录本;我如何将读取计数折叠到基因,我尝试tximport
了 package,但我发现这太难了,因为我的注释不同。
Name NumReads
ENST00000355520.5 407.186
ENST00000566753.1 268.879
ENST00000481617.2 242.25
ENST00000538183.2 226.576
ensembltranscript_id gene_name
ENST00000482226.2 FCGR2C
ENST00000508651.1 FCGR2C
ENST00000571914.1 TSPAN10
ENST00000571707.1 TSPAN10
ENST00000534817.1 OVCH2
ENST00000445557.1 OR52E1
ENST00000575319.1 CYP2D7
ENST00000576465.1 CYP2D7
已编辑
这是 Salmon 读取计数的输出
https://www.dropbox.com/s/7bkril0v6sw7v9z/Salmon_output.txt?dl=0
这是我将 Salmon 输出中的转录本 id 转换为基因名称的时候
https://www.dropbox.com/s/m1iybfbu2i4bb39/Converting_transcript_id_to_gene_id.txt?dl=0