在这里开始 Python 和 BeautifulSoup 用户。
我正在尝试从 ESPN 网站上获取一些运动成绩,但返回是空的。
样本目标:ESPN 网站 > NBA > 得分
我想获取一些信息,例如团队名称、分数、记录和四分之一/决赛,但由于我遇到了问题,我就从分数开始。我想得到球队的总分。
from bs4 import BeautifulSoup as bs
from urllib.request import urlopen as uReq
html_url = 'http://www.espn.co.uk/nba/scoreboard'
uClient = uReq(html_url)
page_html = uClient.read()
uClient.close()
page_soup = bs(page_html, 'html.parser')
containers = page_soup.findAll('td',{"class":"total"})
print (len(containers))
print (type(containers))
输出
0
<class 'bs4.element.ResultSet'>
我花了一整天的时间试图弄清楚为什么我的所有结果都不断返回 NoneType 和空我似乎无法弄清楚。
我试着寻找'td',这就是结果
containers = page_soup.findAll('td')
print (len(containers))
print (type(containers))
输出
0
<class 'bs4.element.ResultSet'>
不知道为什么我无法提取数据。ESPN 是否故意不允许我们抓取的幕后发生了什么?我尝试过查看不同的标签、属性等,但无法弄清楚。谢谢