我在 python 中有两个非常大的文件(每个超过 1.000.000 个条目)的问题:我需要生成一个过滤器,但我不知道为什么,我有两个这样的文件:
1,2,3
2,4,5
3,3,4
第二个
1,"fege"
2,"greger"
4,"feffg"
每个文件行的第一项始终是 ID。现在我想过滤列表,第一个列表只包含 ID 在第二个文件中的项目。对于此示例,结果应为:
1,2,3
2,4,5
如何以非常快速的方式做到这一点?核心问题是,每个列表都非常非常长。我用s.th。像这样:
[row for row in myRows if row[0] == item[0]]
但这需要很长时间才能运行。(超过 30 天)