python - 更新不在磁盘上的大型 DataFrame 对象。

Question

我一直在通过处理在线获得的大型 csv 文件来了解 Pandas 的来龙去脉，这些文件是财务数据的时间序列。到目前为止，我已经弄清楚了如何使用 HDFStore 来存储和操作它们，但是我想知道是否存在一种更简单的方法来更新文件，而无需重新下载整个源文件？

我问是因为我正在处理 12 ~300+MB 的文件，每 15 分钟更新一次。虽然我不需要更新是连续的，但不下载我已经拥有的东西会很好。

score 1 · Accepted Answer

1

Continuum的Blaze库应该可以帮助您。你可以在这里找到介绍。

于 2014-09-12T23:56:42.740 回答

1 回答 1