我有一个文件,每行包含空格分隔的数字。每行对应一个数字列表。
现在大约有 300,000 条这样的行(每行平均包含大约 100 个数字)。
我想找到所有此类列表的相互交集,即第一个列表与所有其他列表相交,然后第二个列表与所有其他列表相交,依此类推。
我在用
set(a) & set(b)
其中 a 和 b 是我在双循环中迭代的列表。
但这需要太多时间。例如:对于与所有其他列表相交的第一个列表,大约需要 3 分钟。
我怎样才能有效地做到这一点?(可能与其他一些语言/工具一起使用)