我必须通过组合两个不同的文件来处理一些数据。它们都有两列可以形成一个主键,我可以用它来并排匹配它们。有问题的文件很大(大约 5GB,有 2000 万行),所以我需要一个高效的代码。我将如何在 Perl 中执行此操作?
我举个例子:
如果文件 A 包含列
id, name, lastname, dob, school
文件 B 包含列
address, id, postcode, dob, email
我需要通过匹配这两个文件中的id和dob来加入这两个文件,以获得一个包含以下列的输出文件:
id, name, lastname, dob, school, address, postcode, email