我正在从网页解析数据,有时这些表格有不必要的回车,这给我带来了问题。我想删除回车,但一个简单的 strip() 不起作用。
我有以下代码:
html = """
<table>
<tr>
<td>
Commercial, financial and agricultural</td>
<td>
791
</td>
</tr>
</table>
"""
soup = BeautifulSoup(''.join(html))
table = soup.find('table')
rows = table.findAll('tr')
for tr in rows:
rowdata = ''
columns = tr.findAll('td')
for td in columns:
cell = ''.join(td.findAll(text=True))
cell.strip()
rowdata = rowdata+'|'+cell
print rowdata
输出是:
|
Commercial, financial and agricultural|
791
我希望输出为:|商业、金融和农业|791
为什么 strip 函数不删除回车符?