1

我有一个python脚本来处理一个文件夹中的几个文件,结果是这样的,有两列叫做user_agent和user_type

firefox, pc
IE, pc
iPhone, mobile
....

由于来自相同或不同文件的结果可能会重复,因此我使用列表来跟踪唯一组合。

if (user_agent,user_type) not in lookuplist:
   lookuplist.append((user_agent,user_type))
   print user_agent,user_type

现在的问题是,由于我有多个要解析的原始数据文件,如何在一个文件完成时“保存”查找列表,而当第二个文件启动时,它仍然知道,例如 (firefox, pc) 有已经存在,那么我不会有重复的结果

非常感谢

4

1 回答 1

0

首先,您应该set为您的lookuplist. 其次,在循环中打开所有文件并在循环中检查重复项。

于 2012-04-04T14:12:13.227 回答