我正在从 Internet 上抓取一张表格并保存为 CSV 文件。文本中有带法语口音的字符,导致保存时出现 unicode 错误:
UnicodeEncodeError: 'ascii' codec can't encode characters in position 5-6: ordinal not in range(128)
我想找到一个优雅的解决方案来保存可以应用于任何情况的重音字符。我有时使用以下内容:
encode('ascii','ignore')
但这一次它不起作用,原因不明。我也在尝试替换<sup>
单元格中的标签,所以我str()
首先使用它进行转换。
这是我的代码的相关部分:
data = [
str(td[0]).split('<sup')[0].split('>')[1].split('<')[0],
td[1].getText()
]
output.append(data)
csv_file = csv.writer(open('savedFile.csv', 'w'), delimiter=',')
for line in output:
csv_file.writerow(line)