我一直在通过处理在线获得的大型 csv 文件来了解 Pandas 的来龙去脉,这些文件是财务数据的时间序列。到目前为止,我已经弄清楚了如何使用 HDFStore 来存储和操作它们,但是我想知道是否存在一种更简单的方法来更新文件,而无需重新下载整个源文件?
我问是因为我正在处理 12 ~300+MB 的文件,每 15 分钟更新一次。虽然我不需要更新是连续的,但不下载我已经拥有的东西会很好。
我一直在通过处理在线获得的大型 csv 文件来了解 Pandas 的来龙去脉,这些文件是财务数据的时间序列。到目前为止,我已经弄清楚了如何使用 HDFStore 来存储和操作它们,但是我想知道是否存在一种更简单的方法来更新文件,而无需重新下载整个源文件?
我问是因为我正在处理 12 ~300+MB 的文件,每 15 分钟更新一次。虽然我不需要更新是连续的,但不下载我已经拥有的东西会很好。