我有以下代码。
html = urllib2.urlopen(
'https://ebet.tab.co.nz/results/CHCG-reslt05070400.html').read()
soup = BeautifulSoup(html)
data = soup.findAll('div', {'class' : 'header bold'})
match = re.search('R', data[0].text)
race_title = data[0].text[(match.start()):]
race_title = str(race_title.strip(' \t\n\r'))
print race_title
我在控制台屏幕上得到的输出如下
Race 1 PEDIGREE ADVANCE SPRINT
C0
295 m
我认为 strip 会消除 SPRINT 和 C0 之间的任何类型的空格,但显然我遗漏了一些东西,所以我需要帮助来理解这个结果。是因为bs4以unicode输出字符串还是什么?