0

我的理解是来自 Illumina HiSeq/MiSeq 平台的配对末端读取看起来像这样:

R1:
    AAAAAACCCCCC
R2:
    GGGGGGTTTTTT

R2 中的读数与 R1 中的读数相反。然而,对于我的测序数据,情况似乎并非如此。如果它有帮助,我可以从下面的 MiSeq 运行中获得一对读取。

R1:
@M01814:86:000000000-A6MU9:1:1101:15397:1339 1:N:0:2
TACTCGCACCTATCCGGCACAGCAACACCATCTGGGGCTGAATCGCAATAGCATCTCTCACTTCCTCCATATCAGATTGCTCAAGGCAAGCACTACGCTGCAGTGCCCTCCACTCCCAATTCCCTGATGCTGGTCGTAACTTGCCACACCA
+
>>AA?BBBBBFFGGG2EEEGFBGHHHGA2FGHBGHF2EE?GHGHHFFEEHDGHEFGF5FEEFBGHGBCB5FHHH5F553@434FF31G11??233B1/1/?333B?3FB?/B24B2/2B2?44?3?23333B223<>@0CB22@2@F0/?/

R2:
@M01814:86:000000000-A6MU9:1:1101:15397:1339 2:N:0:2
TAAGGGGCCTAGAACAGGCACCATACATTCAATTGGCTGTGGCAAGTAACAACCAGCATCAGGGAATGTGGAGTGGAGGGCACTGCAGCGAATTGCTTGCCTTGAACAATCTTATATGGGGGAAGTAGACGAACCAATGTGGAGTCAGCCC
+
>AA>>>ADDAFFGGGGG4FGGGFHFHFHHHFHHHB3B32EFBGGE25FGHHHHACEGG533BAGFFF355331BG1@1>EF1E23F333/>//134B43?F34B3334B334444?443B?/<C/23333////<0/<11111/?01?G0?
4

1 回答 1

1

简短回答:通常 R1 和 R2不是彼此的反向互补。

更长的答案: 反向读取以反向方式测序,但反向读取的内容不一定是正向读取的反向互补。大多数情况下,您想要测序的 DNA 片段比 MiSeq 实际可以测序的约 100bp(或高达 300bp,具体取决于来源)长得多。因此,对片段的末端进行了测序,您只知道正向和反向读取的序列以及它们之间的距离(如果我没记错的话,内部配对距离)。这张来自 Illumina 网站的图表显示了这一点。

假设您可以测序 10bp 并且想要测序长度为 25 的片段:

---r1---->
AAAAACCCCCGGGGGTTTTTAAAAA
               <----r2---

在这种情况下,您的内部配对距离为 5(读取之间的未测序碱基的 nr 个),您将无法获得有关读取之间序列的信息(在此示例中为所有 G)。如果您像这样分析较小的片段大小

---r1---->
AAAAACCCCCGGGGG
     <----r2---

你的读数重叠,你得到一个负的内配对距离。然后你会得到一些你所描述的冗余信息,但通常情况并非如此。

您可以在此处找到有关该方式的另一篇有用的文章。

我希望这有帮助。

于 2015-10-15T12:45:17.777 回答