我在 Linux 中有两个文件一个文件有两列和 3 亿行,另一个文件有一列和 1498 行(来自 HG19 的 SNPs rs ID)。
第一个文件如下所示。第一列有坐标并且在坐标值之间有冒号 (1:10019:TA:T),第二列有 ID (rs775809821)
1:10019:TA:T rs775809821
1:10039:A:C rs978760828
1:10043:T:A rs1008829651
1:10051:A:G rs1052373574
1:10055:T:A rs892501864
1:10055:T:TA rs768019142
1:10165:A:AC rs796884232
第二个文件只有一列,看起来像这样
rs11234969
rs372076
rs10417746
rs2476601
rs10760127
我想将第二个文件中的值与第一个文件中的值相匹配,这样我就可以拥有一个最终文件,其中包含文件 2 中的所有可能行及其来自文件 1 的坐标。
我试过'grep'和awk但没有成功。
grep -F file1.txt file2.txt | cut -d ' ' -f1 > grep.txt
最终文件应该包含所有可能的 ID (rs.....),这些 ID 在两个文件中都具有相同的坐标。