我正在使用 BeautifulSoup为ez_setup.py和get-pip.py脚本链接抓取 pip 安装指南网页。当我找到这些链接时,我使用 BeautifulSoup 的 get_text() 来获取所有文本。
现在,这适用于 get-pip.py 链接,但不适用于 ez_setup.py 链接。我检索了 get-pip.py 的所有文本,但对于 ez_setup.py,我只检索到第 318 行的文本,这甚至不是完整的第 318 行。
317 if options.user_install:
318 if sys.version_info
这是我的代码。
#imports
def makeSoup(url):
return BeautifulSoup(urllib2.urlopen(url).read())
url = "http://www.pip-installer.org/en/latest/installing.html"
for url in makeSoup(url).find_all('a', attrs = {'href':re.compile(r'py$')}):
with open(desktop + "\\" + url['href'].split('/')[-1], "w", 0) as file:
file.write(makeSoup(url['href']).get_text())
如何检索 ez_setup.py 的所有文本?