我有以下格式的数据:
<abc> <anything2> <anything3>.
<_901> <first> <something1>.
<_905> <second> <something2>.
<_910> <anything> <something3>.
<_901> <second> <something4>.
<_905> <first> <something6>.
<_901> <third> <something5>.
<_905> <third> <something7>.
现在,我想将与第一列和第二列的(第一、第二、第三)值对应的所有信息组合在一起,以便获得以下形式的聚合信息:
<abc> <anything2> <anything3>.
<_901> <something1> <something4> <something5>.
<_905> <something6> <something2> <something7>.
<_910> <anything> <something3>.
我尝试使用 python 字典来实现这一点。但是因为我有一个 2 Tera 字节的文件。我的程序内存不足,效率很低。python中有没有更快的方法来实现这一点。如果是,那么有人可以举例说明吗?