0

这是我在 python 中生成链接对象列表的代码。我想从它们中删除重复项。

cb = list()
for link in br.links(url_regex="inquiry-results.jsp"):
        cb.append(link)
print set(cb)

但它返回错误unhashable instancelink是这样的 -

Link(
    base_url='http://casesearch.courts.state.md.us/inquiry/inquirySearch.jis',
    url='/inquiry/inquiry-results.jsp?action=..........',
    text='12',
    tag='a',
    attrs=[('href', '/inquiry/inquiry-results.jsp?action=.......'),
    ('title', 'Go to page 12')]
    ),

[为方便起见添加了换行符和点]

如何删除重复项?

4

1 回答 1

3

您可以使用 URL 作为键来构造字典并获取其值:

cb = {}
for link in br.links(url_regex="inquiry-results.jsp"):
    cb[link.url] = link
print cb.values()
于 2010-08-06T07:23:55.907 回答