0

我只想得到 dd 里面的东西。我有这个代码:

import urllib
from bs4 import BeautifulSoup

url = 'http://www.brothersoft.com/windows/mp3_audio/'
pageHtml = urllib.urlopen(url).read()
soup = BeautifulSoup(pageHtml)

for a in soup.select('div.coLeft.cate.mBottom a[href]'):
    print "http://www.brothersoft.com"+ a['href']

但是输出给出了类内的所有内容。我只需要 dd 里面的项目。如何得到它?

4

1 回答 1

1

只是dd介于两者之间:

for a in soup.select('div.coLeft.cate.mBottom dd a[href]'):
    #                                         ^^
    print "http://www.brothersoft.com"+ a['href']
于 2013-08-26T07:25:11.377 回答