我试图了解 UTF-8、ASCII 和 Unicode 之间的区别。我已经阅读了Unicode、UTF、ASCII、ANSI 格式差异。但是我从 Python 中得到了一些错误,我不知道如何才能看到我的字符串具有哪种格式。
例如:
1# 'Klaus-Groth-Straße, Ballahausen'
2# 'Capit\xe1n\n'
3# u'Capit\xe1n\n'
我推测
- 3# = Unicode,因为
u'
? - 1#=?
- 2#=?
我已经尝试将字符串 #1 写入文件并为自己编写了一个小函数
def escape(html):
html=html.replace('ö','ö')
html=html.replace('Ö','Ö')
html=html.replace('ä','ä')
html=html.replace('Ä','Ä')
html=html.replace('ü','ü')
html=html.replace('Ü','Ü')
html=html.replace('ß','ß')
return html
在我将字符串写入txt
文件之前,我想替换字母以在我的文本文件中获得正确的拼写(Klaus-Groth-Straße,Buchholz in der Nordheide)。
但它不起作用:/
你能告诉我我的 3 个示例属于哪种字符串 - Unicode 或 ASCII 或 UTF-8?以及如何txt
使用 #1 之类的字符串将正确的拼写写入 a?