1

是否可以在 beautifulSoup 中设置我只能打印<img>其内容中的链接?

目前我的代码如下所示:

import urllib
import re
import mechanize
from bs4 import BeautifulSoup
import urlparse

url = "http://www.nytimes.com"

htmlcontent = urllib.urlopen(url)
soup = BeautifulSoup(htmlcontent)
for link in soup.find_all('a'):
    print link.contents

打印出链接内的所有内容。但我真正需要的是打印其中包含<img>标签的链接内容,我不知道该怎么做......

欢迎任何帮助

4

1 回答 1

1

只需尝试img在链接中查找标签:

for link in soup.find_all('a'):
    if link.find('img'):
        print link
于 2013-08-02T13:29:18.080 回答