1

我使用这段代码:

from bs4 import BeautifulSoup

parser = BeautifulSoup(remote_data)
parse_data = parser.find_all('a')
for atag_data in parse_data:
    URL_list = atag_data.get('href')

当我尝试将 URL_list 拆分为数组时:

array = str.split(URL_list)

我给这3个数组:

['index1.html']
['example.exe']
['document.doc']

但我只需要一个数组,例如:

['index1.html','example.exe','document.doc']

请问有什么建议吗?

4

1 回答 1

0

你没有得到一个数组——它是一个列表!此外,您应该避免命名变量,如内置函数。

关于你的问题:

from bs4 import BeautifulSoup
parser = BeautifulSoup(remote_data)
link_list = [a['href'] for a in parser.find_all('a')]
于 2012-11-09T11:32:33.737 回答