我正在尝试使用 python 2 生成一个有效的 utf-8 字符串。
def validate_mychar(cd_rng):
return unichr(cd_rng)
def get_utf8_char():
while True:
cd_rng = random.randint(0x100, 0xFFFF)
if validate_mychar(cd_rng):
return unichr(cd_rng)
def utf8_gen(length):
return u''.join(get_utf8_char() for i in xrange(length))
print(utf8_gen(10000))
但我想知道为什么在使用这些字符时会出现奇怪的“无效字符”。任何人都可以帮助提供工作代码吗?