1

我正在尝试重现本文的树状图结果涉及特定的 16s rRNA 分析。

但我不知道是否有数据管理或数据分析的标准方法。所以,我一直在自己尝试。下面,总结一下。

在方法部分中说:“生成的 FASTQ 文件存放在https://www.ncbi.nlm.nih.gov/bioproject/PRJNA386442。随后使用 ea-utils v1 合并 MiSeq 配对末端原始序列正向和反向读取.1.2 使用标准设置,然后是 QIIME v1.9.1 的拆分库步骤和删除序列读取短于 200 个核苷酸、包含不明确碱基的读取或平均质量得分低于 30 的读取。”

因此,我使用 SRATOOLKIT 下载了 sra 文件并在终端使用了以下代码:

for n in {141..188}; do prefetch "SRR5577$n"; done

后来,我使用以下方法转换为 fastq 文件:

for n in {141..188}; do fastq-dump "SRR5577$n"; done

但是,对于合并步骤,我不能使用github 上包fastq-join中的函数或任何其他函数。ea-utils数据似乎没有正确的格式。

我做得好吗?我在哪里可以了解有关此类分析的更多信息?

4

1 回答 1

2

我建议--split-files在 f astq-dump中使用,例如:

for n in {141..188}; do fastq-dump --split-files "SRR5577$n"; done

看起来数据是双端的。否则你不需要合并它们。它会给你单独的正向和反向读取文件,大概是你输入到 ea-utils 的。

于 2020-09-20T11:46:01.020 回答