我在一个文件夹里有很多很多文件,我想一个接一个地处理,我需要一个全局字典来记录用户标识符和流量,但是如果我的代码是这样的,当第二个或第三个文件是处理后,最后一个文件的 user_dict 将丢失。
因为如果第二个文件中的用户 id 与第一个文件中的用户 id 相同,那么如果应该分配相同的 flowcount 而不是一个新的,我怎样才能让一个字典在一个一个打开文件时保持增长?
for line in fd.readlines():
obj = json.loads(line)
user = obj["host_dst"]["addr"] + '_' + str(obj["host_dst"]["port"])
if user not in user_dict:
user_dict[user] = []
user_dict[user].append(obj["params"]["flowcount"])
由于每个文件都很大,我把它们都合并成一个文件,然后运行脚本处理,电脑过一会就会杀掉进程,我只好一个一个处理