我有两个格式如下的文件。
File1: - 它包含 4 列。第一个字段是文本格式的 ID,其余列也是一些文本值。
id1 val12 val13 val14
id2 val22 val23 val24
id3 val32 val33 val34
文件2 - 在文件 2 中,我只有 ID。
id1
id2
输出
id3 val32 val33 val34
我的问题是:如何从第一个文件中查找 ID(第一个字段)未出现在第二个文件中的行。这两个文件的大小都非常大,file1 包含 4200 万行,大小为 8GB,file2 包含 3300 万个 ID。两个文件中的 ID 顺序可能不同。