0

我正在尝试在 python 中编写一个从特定站点下载图像的图像存档器,并且我不断收到一个 ioerror errno22 无效模式 ('r') 或出现在我的 beautifulsoup 行上的文件名错误

soup = BeautifulSoup(open(pahealUrl))

aTagList = soup.findall("a")

for randomTag in aTagList:
  if randomTag.find(text="Image Only"):
    imageList.append(randomTag) 

print randomTag

url 本身是有效的,我没有看到问题所在。知道为什么它会抛出 errno22 invalid mode /filename 错误吗?

4

1 回答 1

1

要获取网页的 html,请使用以下urllib2库:

import urllib2
html = urllib2.urlopen(myurl).read()

open()不用于打开网页,而是用于文件。这就是您收到文件名错误的原因。

然后你可以BeautifulSoup()用 HTML 来获取你的汤。

于 2013-04-02T07:01:48.353 回答