我正在尝试从维基百科的 API 中获取一个页面,并使用 Python 将该页面打印到一个文件中。
json_data = json.loads(issue_request(params_html))
document = json_data['parse']['text']['*'].encode('utf-8')
a = open('test.html', 'wb')
a.write(document)
我发出的请求是http://pt.wikipedia.org/w/api.php?action=parse&prop=text&page=Dia_dos_Namorados&format=json
问题是,当我在浏览器中打开“test.html”时,所有重音字符都被错误地呈现,所以我看到类似:Dia de São Valentim。
我尝试了各种不同的编码方案,包括编码为“latin-1”或使用编解码器,但到目前为止都没有奏效。有趣的是,如果我在文本编辑器(崇高)中打开文件,重音字符显示正常。只是在浏览器中它们看起来很有趣。