我正在使用lxml 和 python来抓取页面。该页面的链接是这里。我现在面临的问题是如何获取标签中的属性。例如页面顶部的 3 颗金星,它们有一个 html
<abbr title="3" class="average rating large star3">★★★☆☆</abbr>
在这里,我想获取标题,以便知道该位置获得了多少颗星。
我尝试过做几件事,包括:
response = urllib.urlopen('http://www.insiderpages.com/b/3721895833/central-kia-of-irving-irving').read()
mo = re.search(r'<div class="rating_box">.*?</div>', response)
div = html.fromstring(mo.group(0))
title = div.find("abbr").attrib["title"]
print title
但对我不起作用。帮助将不胜感激。