0

我正在使用 python 2.7 和 Pandas 使用 Pandas'read_csv'方法加载一个有点大的 csv 文件(~10G)。直到今天,此操作过去需要 3-4 分钟,然后突然开始需要数小时才能完成。这台机器有 30G RAM 和多个 CPU,我检查了使用情况,几乎所有的内存和 CPU 都是空闲的。此外,大多数时候进程的状态是“D”(Linux机器),我读到这通常发生在等待I/O期间?

如何调试它以找出导致问题的原因?

谢谢

4

0 回答 0