我正在使用 Beautiful Soup 来吸引过去奥运会的奖牌获得者。在某些赛事和运动员姓名中使用口音会让人感到不安。我在网上看到过类似的问题,但我是 Python 新手,无法将它们应用到我的代码中。
如果我打印我的汤,口音看起来很好。但是当我开始解析汤(并将其写入 CSV 文件)时,重音字符会变得乱码。'Louis Perrée' 变成 'Louis Perr√©e'
from BeautifulSoup import BeautifulSoup
import urllib2
response = urllib2.urlopen('http://www.databaseolympics.com/sport/sportevent.htm?sp=FEN&enum=130')
html = response.read()
soup = BeautifulSoup(html)
g = open('fencing_medalists.csv','w"')
t = soup.findAll("table", {'class' : 'pt8'})
for table in t:
rows = table.findAll('tr')
for tr in rows:
cols = tr.findAll('td')
for td in cols:
theText=str(td.find(text=True))
#theText=str(td.find(text=True)).encode("utf-8")
if theText!="None":
g.write(theText)
else:
g.write("")
g.write(",")
g.write("\n")
非常感谢您的帮助。