我正在用 tweepy 处理推文:
class StdOutListener(StreamListener):
def on_data(self, data):
process(json.loads(data))
return True
l = StdOutListener()
stream = Stream(auth, l)
stream.filter(track=utf_words)
该process
函数获取包含在推文中的 URL(带有请求)的内容,使用 nltk 处理数据(我猜这会占用一点 CPU)并将结果保存到 Mongo。
问题是获取包含 URL 的内容需要很长时间,因此限制了我的处理速度。我如何以python方式加速这件事?