我有一个正则表达式来检测 unicode 字符串中的无效 xml 1.0 字符:
bad_xml_chars = re.compile(u'[^\x09\x0A\x0D\u0020-\uD7FF\uE000-\uFFFD\U00010000-\U0010FFFF]', re.U)
在 Linux/python2.7 上,这可以完美运行。在 Windows 上会引发以下问题:
File "C:\Python27\lib\re.py", line 190, in compile
return _compile(pattern, flags)
File "C:\Python27\lib\re.py", line 242, in _compile
raise error, v # invalid expression
sre_constants.error: bad character range
任何想法为什么这不在 Windows 上编译?