python - 如何将大文件中的数据放入熊猫数据框中？

翻译自：https://stackoverflow.com/questions/17464746 2013-07-04T07:53:32.623

137 次

通常，当我想将文件的内容放入数据框中时，我会在文件的行上进行循环，将行拆分为字段并使用此值来指定字典。读完一行后，我将字典附加到一个列表中（因此，列表中的字典数等于文件中的行数）。然后我使用字典列表来构造一个数据框。

不幸的是，这种方法对于大文件失败了。在文件的 60 万行之后，我的 python 脚本变得非常慢并且我的 Ubuntu 挂起。

我认为这是因为将一个新元素附加到一个巨大的列表变得很慢并且使用了大量的内存。有没有更好的方法将文件中的信息提取到数据框中？

0 回答 0