我真的很想整理一些数据。我有一些数据想使用 Python 在 CSV 中排序。如果有人可以提供帮助,将不胜感激。它无法在 Excel 中排序,因为行数太多(>1500 万)。
格式如下:
X,Y,Level,ID,XYID
15.5,16.5,1.6,HB01,15.516.5
15.5,17.5,1.4,HB01,15.517.5
15.5,18.5,1.7,HB01,15.518.5
15.5,19.5,1.6,HB01,15.519.5
15.5,20.5,1.2,HB01,15.520.5
15.5,20.5,1.9,HB02,15.520.5
15.5,20.5,2.5,HB03,15.520.5
15.5,20.5,2.1,HB04,15.520.5
XYID 只是 X 和 Y 的连接文本。我希望对数据进行排序,以便在第二个块中,唯一出来的行如下,因为它具有最高级别(第三列)并且具有相同的 XYID
15.5,20.5,2.5,HB03,15.520.5
我希望最终输出是显示前四行的 csv 文件,因为它们具有不同的 XYID,而新的第 5 行显示最大级别:
X,Y,Level,ID,XYID
15.5,16.5,1.6,HB01,15.516.5
15.5,17.5,1.4,HB01,15.517.5
15.5,18.5,1.7,HB01,15.518.5
15.5,19.5,1.6,HB01,15.519.5
15.5,20.5,2.5,HB03,15.520.5