我是 python 新手。我想做的是用python和美丽的汤提取今年格拉斯顿伯里音乐节宣布的所有乐队。我想将所有乐队转储到一个文本文件中,并最终根据每个艺术家的热门曲目创建一个 Spotify 播放列表。
我想从www.efestivals.co.uk/festivals/glastonbury/2013/lineup.shtml#中提取的艺术家列表(我实际上想在 AZ 标签上而不是在 Friday 标签上)
我曾尝试先将波段打印到终端,但我得到空白结果。这是我尝试过的
from bs4 import BeautifulSoup
import urllib2
#efestivals page with all glastonbury acts
url = "http://www.efestivals.co.uk/festivals/glastonbury/2013/lineup.shtml#"
page=urllib2.urlopen(url)
soup = BeautifulSoup(page.read())
bands = soup.findAll('a')
for eachband in bands:
print eachband.string
基本上,我需要帮助才能进入 AZ 选项卡并提取每个波段。我也只想要确认的乐队(那些有img src="/img2009/lineup_confirmed.gif"
)。我对 html 不是很熟悉,但这似乎是一个合理的起点。