我正在尝试找到使用 Python 将一些数据附加到 json 文件的最佳方法。基本上发生的事情是我有大约 100 个线程打开将数据存储到数组中。完成后,他们使用 json.dump 将其发送到 json 文件。然而,由于这可能需要几个小时才能建立阵列,我最终会用完 RAM。所以我想看看在这个过程中使用最少内存的最佳方法是什么。以下是我所拥有的消耗大量 RAM 的内容。
i = 0
twitter_data = {}
for null in range(0,1):
while True:
try:
for friends in Cursor(api.followers_ids,screen_name=self.ip).items():
twitter_data[i] = {}
twitter_data[i]['fu'] = self.ip
twitter_data[i]['su'] = friends
i = i + 1
except tweepy.TweepError, e:
print "ERROR on " + str(self.ip) + " Reason: ", e
with open('C:/Twitter/errors.txt', mode='a') as a_file:
new_ii = "ERROR on " + str(self.ip) + " Reason: " + str(e) + "\n"
a_file.write(new_ii)
break
## Save data
with open('C:/Twitter/user_' + str(self.id) + '.json', mode='w') as f:
json.dump(twitter_data, f, indent=2, encoding='utf-8')
谢谢