我的几个 python 程序旨在
格式化成哈希表(因此,我是一个 dict() 瘾君子 ;-) )“源”文本文件中的一些信息,以及
使用该表来修改“目标”文件。我担心的是,我通常处理的“源”文件可能非常大(几 GB),因此解析时间超过 10 秒,我需要多次运行该程序。总而言之,我觉得每次我需要修改一个新的“目标”时重新加载同一个大文件是一种浪费。
我的想法是,如果有可能编写一次由“源”文件生成的 dict() 以使 python 能够更快地读取/处理(我认为一种格式接近 RAM 中使用的格式)通过python),那会很棒。
有没有可能实现这一目标?
谢谢你。