参数的有效范围取决于 Python 的配置方式——它可能是 UCS2 [0..0xFFFF] 或 UCS4 [0..0x10FFFF]
和
如果给出了 unicode 参数并且 Python 是使用 UCS2 Unicode 构建的,那么字符的代码点必须在 [0..65535] 范围内;否则字符串长度为 2,并且会引发 TypeError。
是否有关于代码单元的两种定义在生产 python 解释器中的广泛使用的统计数据?
#!/usr/bin/env python
知道使用类似的东西以及根据运行它的用户的环境使用不同的代码单元定义运行的python 脚本有多普遍吗?
背景:
我想知道为 python 2.x 制作解析器生成器后端需要做多少工作才能生成一个适用于两种配置的库,因为Python 3 收紧了 this。
具体来说,我是否可能会不必要地膨胀生成的代码包
# Module my_generated_parser
try
unichr(0x10000)
except ValueError:
from my_generated_parser_ucs2 import *
else:
from my_generated_parser_ucs4 import *
并默认包括两个生成的解析器?