0

我正在尝试http://robobrowser.readthedocs.org/en/latest/readme.html,这是一个基于美丽汤库的新 python 库。

我有以下 HTML:

我有以下 django 视图功能

def index(request):    

    p=str(request.POST.get('p', False)) # eg. p='https://www.yahoo.com/'
    browser = RoboBrowser(history=True)
    postedmessage = browser.open(p)
    out = browser.select('span.select')

    return HttpResponse(postedmessage)

出产量:

<span class="select"><a href="/selector/1">select</a></span>

但是如何使用美丽的汤选择内部标签?

4

1 回答 1

3

只需添加a到传递给soup.select()方法的 CSS 选择器:

out = browser.select('span.select a')

或者,通过将标记名作为属性寻址来导航到第一个匹配的子标记:

out = browser.select('span.select')
links = [span.a for span in out]
于 2014-04-30T16:13:12.483 回答