3

我找到了很多用于以 fastq 格式修剪读取的工具,但是是否有任何可用于修剪已经对齐的读取的工具?

4

4 回答 4

3

我个人不鼓励在对齐读取后修剪读取,特别是如果您尝试修剪的序列是接头序列。

这些接头序列的存在将阻止您的读数与基因组正确对齐(根据我的经验,您应该得到的对齐百分比要低得多)。由于您的对齐已经不准确,因此在对齐后修剪序列(垃圾输入,垃圾输出)将毫无意义。

在对齐它们之前修剪 fastq 文件会更好。

于 2013-08-06T03:32:10.180 回答
0

Do you want the alignment to be informing the trimming protocol, or are you wanting to trim on things like quality values? One approach would be to simply convert back to FASTQ and then use any of the myriad of conventional trimming options available. You can do this with Picard:

http://picard.sourceforge.net/command-line-overview.shtml#SamToFastq

于 2012-05-02T06:31:34.363 回答
0

一种可能性是使用 GATK 工具集,例如 ClipReads。如果要移除适配器,可以使用 ReadAdaptorTrimmer。无需转换为 fastq(文档:http ://www.broadinstitute.org/gatk/gatkdocs/ )。

当然,皮卡德是另一种可能性。

于 2014-07-22T14:19:18.347 回答
0

当您在执行大量比对工作后要将读取标准化为相同长度时,会遇到修剪 bam 文件中的读取的情况。修剪 fastq 读取后重新映射不是节能的。在站点读取中,从 bam 文件修剪将是一个首选的解决方案。

请尝试bbmap /reformat.sh,它可以使用接受 bam 格式的输入文件修剪读取。

reformat.sh in=test.bam out=test_trim.bam  allowidenticalnames=t overwrite=true forcetrimright=74 sam=1.4
## the default output format of reformat is sam 1.4. however, many tools only recognize 1.3 version. So the following step is to convert the 1.4 to version 1.3.
reformat.sh in=test_trim.bam out=test_trim_1.3.bam allowidenticalnames=t overwrite=true sam=1.3
于 2020-04-26T08:16:56.857 回答