0

我正在尝试使用 python 2 生成一个有效的 utf-8 字符串。

def validate_mychar(cd_rng):
    return unichr(cd_rng)

def get_utf8_char():
    while True:
        cd_rng = random.randint(0x100, 0xFFFF)
        if validate_mychar(cd_rng):
            return unichr(cd_rng)

def utf8_gen(length):
    return u''.join(get_utf8_char() for i in xrange(length))


print(utf8_gen(10000))

但我想知道为什么在使用这些字符时会出现奇怪的“无效字符”。任何人都可以帮助提供工作代码吗?

4

0 回答 0