我是处理 RNA-seq 数据的新手。我有人类 RNA-seq 数据,现在正在尝试使用 summariseoverlaps 计算基因,但我的所有文件都收到此警告:
“在 .Seqinfo.mergexy(x, y) 中:2 个组合对象没有共同的序列级别。(使用 suppressWarnings() 抑制此警告。)”
这就是我所做的:我将我的 RNA seq 文件与 Ensembl 参考文件 (Homo_sapiens.GRCh38.cdna.all.fa.gz) 对齐并生成 BAM 文件。
seqinfo(bamfiles)`
Seqinfo object with 190508 sequences from an unspecified genome:
seqnames seqlengths isCircular genome
ENST00000633009.1 20 <NA> <NA>
ENST00000634070.1 18 <NA> <NA>
ENST00000632963.1 20 <NA> <NA>
ENST00000633030.1 19 <NA> <NA>
ENST00000633765.1 31 <NA> <NA>
... ... ... ...
ENST00000638565.1 1331 <NA> <NA>
ENST00000673346.1 895 <NA> <NA>
ENST00000673247.1 369 <NA> <NA>
ENST00000672305.1 758 <NA> <NA>
ENST00000671911.1 943 <NA> <NA>
我还从 Ensembl 下载了 GTF 文件:Homo_sapiens.GRCh38.100.gtf.gz
seqinfo(txdb)
Seqinfo object with 47 sequences (1 circular) from an unspecified genome; no seqlengths:
seqnames seqlengths isCircular genome
1 <NA> <NA> <NA>
2 <NA> <NA> <NA>
3 <NA> <NA> <NA>
4 <NA> <NA> <NA>
5 <NA> <NA> <NA>
... ... ... ...
KI270731.1 <NA> <NA> <NA>
KI270733.1 <NA> <NA> <NA>
KI270734.1 <NA> <NA> <NA>
KI270744.1 <NA> <NA> <NA>
KI270750.1 <NA> <NA> <NA>
我猜它与 seqnames 有关,但我不确定我必须做什么。我尝试将其转换为 Ensembl 风格: mapSeqlevels(seqlevels(bamfiles), "Ensembl") mapSeqlevels(seqlevels(txdb), "Ensembl") 但这没有做任何事情......
NB 功能计数也不起作用...
提前致谢!桑德拉