我有一个python脚本来处理一个文件夹中的几个文件,结果是这样的,有两列叫做user_agent和user_type
firefox, pc
IE, pc
iPhone, mobile
....
由于来自相同或不同文件的结果可能会重复,因此我使用列表来跟踪唯一组合。
if (user_agent,user_type) not in lookuplist:
lookuplist.append((user_agent,user_type))
print user_agent,user_type
现在的问题是,由于我有多个要解析的原始数据文件,如何在一个文件完成时“保存”查找列表,而当第二个文件启动时,它仍然知道,例如 (firefox, pc) 有已经存在,那么我不会有重复的结果
非常感谢