我正在尝试将表数据抓取到 CSV 文件中。不幸的是,我遇到了障碍,下面的代码只是为所有后续的 TR 重复第一个 TR 中的 TD。
import urllib.request
from bs4 import BeautifulSoup
f = open('out.txt','w')
url = "http://www.international.gc.ca/about-a_propos/atip-aiprp/reports-rapports/2012/02-atip_aiprp.aspx"
page = urllib.request.urlopen(url)
soup = BeautifulSoup(page)
soup.unicode
table1 = soup.find("table", border=1)
table2 = soup.find('tbody')
table3 = soup.find_all('tr')
for td in table3:
rn = soup.find_all("td")[0].get_text()
sr = soup.find_all("td")[1].get_text()
d = soup.find_all("td")[2].get_text()
n = soup.find_all("td")[3].get_text()
print(rn + "," + sr + "," + d + ",", file=f)
这是我的第一个 Python 脚本,因此我们将不胜感激!我查看了其他问题的答案,但无法弄清楚我在这里做错了什么。