我有一些代码可以从页面http://sports.yahoo.com/nhl/scoreboard?d=2013-04-01输出团队及其所有得分值(不带空格)。
from bs4 import BeautifulSoup
from urllib.request import urlopen
url = urlopen("http://sports.yahoo.com/nhl/scoreboard?d=2013-04-01")
content = url.read()
soup = BeautifulSoup(content)
listnames = ''
listscores = ''
for table in soup.find_all('table', class_='scores'):
for row in table.find_all('tr'):
for cell in row.find_all('td', class_='yspscores'):
if cell.text.isdigit():
listscores += cell.text
for cell in row.find_all('td', class_='yspscores team'):
listnames += cell.text
print (listnames)
print (listscores)
我无法解决的问题是我不太了解 Python 如何使用任何提取的信息并以如下格式为正确的团队提供正确的整数值:
Team X: 1, 5, 11.
该网站的问题是所有分数都属于同一类;所有表都属于同一类。唯一不同的是href。