我对python相当陌生,我不确定解决这个问题的最佳方法是什么。我有一个包含 400 000 行数据的文本文件,每行有 21 列。我想要的任务是按纬度和经度的第 4 行和第 5 行对数据进行分类或排序。我希望将排序后的数据存储或附加到某些东西(即变量或空数组),以便我可以提取排序后的数据以进行进一步处理。首先,我需要导入数据,但我不确定最好的方法是什么。
概述:
- 导入文本文件数据?
- 转换为数组或矩阵进行操作
- 对某些键进行分类
- 将分类数据存储在(箱、空数组或变量)中
我强烈建议为此使用 pandas 库,您可以轻松导入文件,将其转换为数据框,然后使用http://pandas.pydata.org/pandas-docs/dev/generated按两行对其进行排序/pandas.DataFrame.sort.html
如果您可以将文件转换为 csv,那么您可以更轻松地进行操作dataframe = pandas.read_csv(file)
。然后,您可以使用重新保存文件dataframe.to_csv(file)