我有大肠杆菌的 Illumina 配对末端读数,用于创建草稿组装 (SPAdes)。我现在的任务是创建将与 Pilon 一起使用的输入 BAM 文件——它用于改进装配草图。
我决定使用此处的文档来使用 BWA:http: //bio-bwa.sourceforge.net/bwa.shtml#3
计划创建参考基因组的索引,创建比对,然后转换为 BAM 文件。
这是我用来索引参考的命令:
bwa index -p bwa_indices/B055 temp/spades/scaffolds.fasta
此命令输出以下文件:B055.amb B055.ann B055.bwt B055.pac B055.sa
下一步是生成对齐文件——为此我使用了以下命令:
bwa aln -t 20 temp/spades/scaffolds.fasta temp/spades/corrected/B055_S5_R1_filtered_1P.fastq.00.0_0.cor.fastq.gz > bwa_indices/B055_R1.sai
#bwa aln -t 20 temp/spades/scaffolds.fasta temp/spades/corrected/B055_S5_R1_filtered_2P.fastq.00.0_0.cor.fastq.gz > bwa_indices/B055_R2.sai
运行第一个命令后,我收到以下输出:
[bwa_aln] 17bp reads: max_diff = 2
[bwa_aln] 38bp reads: max_diff = 3
[bwa_aln] 64bp reads: max_diff = 4
[bwa_aln] 93bp reads: max_diff = 5
[bwa_aln] 124bp reads: max_diff = 6
[bwa_aln] 157bp reads: max_diff = 7
[bwa_aln] 190bp reads: max_diff = 8
[bwa_aln] 225bp reads: max_diff = 9
[bwa_aln] fail to locate the index
最后一行让我有些恼火。有一个输出文件(B055_R1.sai),但它是空的。
我可以清楚地看到,在我的对齐命令中,没有引用以前创建的任何索引文件,但是当我查看文档时(http://bio-bwa.sourceforge.net/bwa.shtm),我看不到引用任何索引文件的选项。谷歌搜索一下,我找到了一个网站,该网站说我需要将我的参考 fasta 文件与索引文件放在同一目录中,我什至将我的草稿程序集 fasta 文件的名称从scaffolds.fasta 更改为 B055.fasta - 但是无济于事。我还解压缩了 fastq.gz 文件并将扩展名从 fastq 更改为 fq——所有这些都遇到了不成功的结果。这些可能仍然是问题,但在我看来,在最后一次 bwa aln 调用中引用索引文件是最紧迫的问题。
谁能给我指出正确的方向?我正在使用 BWA 版本:0.7.5a-r405(我还安装了最新版本(版本:0.7.12-r1039),没有任何改进),CentOS 6.7,具有 34 个内核和大量内存。
先感谢您。