在SAM格式中,每条对齐线代表一个段的线性对齐,每条线有11个必填字段,即QNAME、FLAG、RNAME、POS、MAPQ等。
假设我想要一个给定 BAM 文件中所有“QNAMES”的 NumPy 数组。或者,可以采用几列并将它们导入 Pandas Dataframe。
pysam 可以实现此功能吗?
人们可以很自然地用 来打开给定的 BAM 文件,pysam.AlignmentFile()
然后用 来访问各个段pysam.AlignmentSegment()
,例如
seg = AlignmentSegment()
print(seg.qname)
但是,您可以将所有 QNAMES 保存到 NumPy 数组中吗?