在进行了一些网络抓取和组合结果之后,我得到了一个字典列表。其中一个键(标题)是列表列表。
thelist = [{"name":"a name", "titles":[["foo","bar", ... ],["foo","baz",["..."], ... ]]},
{"name":"another name", "titles":[["foo","bar", ... ],["foo","baz",["..."], ... ]]}, ... ]
目标是消除出现在每个词典的标题列表中的多个列表中的标题,并用单个标题列表(没有重复)替换标题列表列表。
我现在编写的代码可以正确访问列表列表中的所有项目,但实际上我很难消除重复项。
match = ""
for dicts in thelist:
for listoftitles in dicts['titles']:
for title in listoftitles:
title = match
for title in listoftitles:
if match == title:
print title
#del title
似乎 match 永远不会等于 title 中的值。我试过改变循环的嵌套,但到目前为止无济于事。我在某个地方迷路了,我不确定还能尝试什么。任何意见是极大的赞赏。