我有这个代码
import chardet, re
content = "Бланк свидетельства о допуске."
print content
print chardet.detect(content)
content = re.sub(u"(?i)[^-0-9a-zа-яё«»\&\;\/\<\>\.,\s\(\)\*:!\?]", "", content)
print content
print chardet.detect(content)
并输出
Бланк свидетельства о допуске.
{'confidence': 0.99, 'encoding': 'utf-8'}
� � .
{'confidence': 0.5, 'encoding': 'windows-1252'}
我究竟做错了什么?之后如何获得 uft-8 字符串re.sub()
?(Python 2.7, # coding: utf-8
, UTF-8 文件, IDE Pycharm)。
谢谢。