我有一个要组装的链特异性 RNA-seq 库(Illumina)。我想使用 TopHat/Cufflinks。从 TopHat 的手册中,它说,
“--library-type TopHat 会将读取视为链特异性。每个读取对齐都有一个 XS 属性标签。考虑在下面提供库类型选项以选择正确的 RNA-seq 协议。”
这是否意味着 TopHat 仅支持特定于链的协议?我使用选项“--library-type fr-unstred”来运行,这是否意味着它以特定于链的方式运行?我用谷歌搜索并询问了开发人员,但没有得到答案...
我得到了一些结果:
这里的 contig 由两组 reads 组装而成,左侧是反向 reads,而右侧是正向 reads。(为了可视化,我有反向补充正确的伴侣)
但是一些重叠群纯粹是由反向或正向读取组装而成的。如果它是链特异性的,一个基因应该产生相同方向的读数。它不应该像上图那样报告结果,对吗?或者是否有可能一个基因被片段化,然后独立测序,所以碰巧左边部分产生反向读取,而右边部分产生正向读取?据我了解,链特异性通过 3'/5' 连接保持,因此应该以基因为单位。
这里有什么问题?还是我错误地理解了“特定于链”的概念?任何帮助表示赞赏。