我通过 velocyto.py 将 10X bam 文件传输到 loom 文件中,并使用 Scanpy 进行细胞聚类。但是,当我用 Scanpy 进行数据处理时,我发现 loom 文件中没有 mito 基因,见下文。 在此处输入图像描述
运行 velocyto.py 时,它显示:“警告 - .bam 文件引用注释 (.gtf) 文件中不存在的染色体 'MT+'” “警告 - .bam 文件引用染色体 'MT-' 不存在于注释 (.gtf) 文件中”
BAM 文件来自 Cell Ranger v3.1 生成的 10X。参考基因组是 10X 的 refdata-gex-mm10-2020-A.tar.gz。重复注释文件是来自 UCSC 的 mm10_rmsk.gtf。
是不是因为 cell ranger v3.1 太旧,没有与 refdata-gex-mm10-2020-A.tar.gz 和 mm10_rmsk.gtf 相同的染色体名称?但是当我检查BAM中的染色体名称时,我发现它是ChrM,与refdata-gex-mm10-2020-A.tar.gz和mm10_rmsk.gtf一样?那么为什么提示显示 .bam 文件指的是染色体“MT-”?
这是检查 bam 中染色体名称的代码。$ samtools 查看/home/hyjforesight/mybam.bam | 切-f3 | perl -ne '打印除非 $seen{$_}++' - chr1 chr10 chr11 chr12 chr13 chr14 chr15 chr16 chr17 chr18 chr19 chr2 chr3 chr4 chr5 chr6 chr7 chr8 chr9 chrM chrX chrY