0

我有一个要组装的链特异性 RNA-seq 库(Illumina)。我想使用 TopHat/Cufflinks。从 TopHat 的手册中,它说,

“--library-type TopHat 会将读取视为链特异性。每个读取对齐都有一个 XS 属性标签。考虑在下面提供库类型选项以选择正确的 RNA-seq 协议。”

这是否意味着 TopHat 仅支持特定于链的协议?我使用选项“--library-type fr-unstred”来运行,这是否意味着它以特定于链的方式运行?我用谷歌搜索并询问了开发人员,但没有得到答案...

我得到了一些结果:

在此处输入图像描述

这里的 contig 由两组 reads 组装而成,左侧是反向 reads,而右侧是正向 reads。(为了可视化,我有反向补充正确的伴侣)

但是一些重叠群纯粹是由反向或正向读取组装而成的。如果它是链特异性的,一个基因应该产生相同方向的读数。它不应该像上图那样报告结果,对吗?或者是否有可能一个基因被片段化,然后独立测序,所以碰巧左边部分产生反向读取,而右边部分产生正向读取?据我了解,链特异性通过 3'/5' 连接保持,因此应该以基因为单位。

这里有什么问题?还是我错误地理解了“特定于链”的概念?任何帮助表示赞赏。

4

3 回答 3

0

Tophat/Cufflinks 不用于组装,它们用于与已组装的基因组或转录组对齐。你把你的阅读与什么对齐?此外,如果您有特定于链的数据,则不应选择非链库类型。您应该根据您的文库制备方法选择合适的一种。如果您选择非链库类型,XS 标签只会放置在拆分读取上。

于 2012-06-23T19:23:11.140 回答
0

如果你想对你的转录组进行从头组装,你应该看看组装器(而不是映射器),比如

  • 三位一体
  • SoapDeNovo
  • 绿洲……
于 2014-06-06T14:22:40.670 回答
0

Tophat 可以处理滞留库和非滞留库。在您的快照中,中心区域确实具有 + 和 - 链读取。两端的偏差可能是您的文库制备或分析方法的某些特征。这个基因的方向是什么?它看起来有点偏向左侧。如果左侧对应于 3' 末端,那么您的文库制备很可能具有 3' 偏向特征(例如 dT-primed 逆转录) 您对 RNA 进行片段化的方式也可能对您的读数分布产生影响。我想我们需要更多信息才能找到真相。但我们也应该记住,礼帽/袖扣也可能有错误。

于 2015-11-10T18:51:59.803 回答