对于一堂课,我有一个练习,我需要计算任何给定网页上的图像数量。我知道每张图片都以 开头,所以我使用正则表达式来尝试定位它们。但是我一直在数一个我知道是错误的,我的代码有什么问题:
import urllib
import urllib.request
import re
img_pat = re.compile('<img.*>',re.I)
def get_img_cnt(url):
try:
w = urllib.request.urlopen(url)
except IOError:
sys.stderr.write("Couldn't connect to %s " % url)
sys.exit(1)
contents = str(w.read())
img_num = len(img_pat.findall(contents))
return (img_num)
print (get_img_cnt('http://www.americascup.com/en/schedules/races'))