0

我有一对 Illumina 双端读取文件(例如,A_1.fastq.gz 和 A_2.fastq.gz),它们是从单个细菌分离物中产生的,用于变异调用。首先,由于读取长度(100 bp)、插入大小(约 230 bp)及其标准偏差(约 50 bp) ,我使用FLASH合并重叠读取。FLASH 产生了三个读取文件,两个用于非重叠双端读取,一个用于合并读取(单端)。然后我使用 bowtie 将它们与一个常见的参考基因组对齐,这会生成两个 bam 文件(一个用于双端读取,另一个用于单端读取)。

为了获得更高的变异调用覆盖率和读取深度,我想将两个 BAM 文件合并为一个文件。我计划使用BamTools来完成这项任务,因为它专用于处理 BAM 文件。但是,我不确定在调用“bamtools merge”命令之前是否需要对输入的 BAM 文件进行排序?软件教程或其他地方没有涵盖它。如果您能提供帮助,我将不胜感激。

4

1 回答 1

0

嗯,这是一个合并,所以根据定义,输入必须被排序。否则不会合并。

合并是加入两个或多个排序列表保持排序的操作。合并的好处是,当您的输入已经排序时,您不必进行额外的排序。

如果输入没有排序,那么您可以简单地将它们连接起来并对最终结果进行排序,或者对输入进行排序并合并中间结果。

顺便说一句,如果您将未排序的 bam 提供给合并命令,它很可能会抱怨它。

于 2018-06-29T13:26:50.057 回答