0

要更新我的摘要统计文件的 SNP ID,我有一些问题:首先,我从摘要统计文件创建了一个文本文件,其中包含以下信息

1 1118275 vh_1_1108138 G A
1 1120431 vh_1_1110294 A G
1 1135242 rs9729550 C A
1 1140435 rs1815606 A C
1 1163804 rs7515488 A G
1 1165310 rs11260562 A G
1 1173611 rs6697886 A G
1 1186502 rs6603785 T A
1 1194804 rs11804831 G A
1 1218086 rs6603788 A G

我需要更新 rsID 以具有一致的格式(如您所见,有些具有 vh_.. 格式)。然后,我下载了 dbsnp vcf 并选择了以下列

1 10019 rs775809821 TA T
1 10039 rs978760828 A C
1 10043 rs1008829651 T A
1 10051 rs1052373574 A G
1 10051 rs1326880612 A AC
1 10055 rs768019142 T TA
1 10055 rs892501864 T A
1 10063 rs1010989343 A C
1 10067 rs1489251879 T TAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCC
1 10077 rs1022805358 C G

我想知道如何合并列以更新第一个文本文件中的 rsID?2)我注意到第二列有不同的格式(染色体位置)。我不知道这是否会导致问题。如果是的话,我怎么能更新它。我感谢任何帮助

4

0 回答 0