我有一个 unicode 字符串,我需要返回前 N 个字符。我正在这样做:
result = unistring[:5]
但当然是 unicode 字符串的长度!= 字符的长度。有任何想法吗?唯一的解决方案是使用 re?
编辑:更多信息
unistring = "Μεταλλικα" #Metallica written in Greek letters
result = unistring[:1]
返回->?
我认为 unicode 字符串是两个字节(char),这就是发生这种情况的原因。如果我做:
result = unistring[:2]
我明白了
M
这是正确的,那么,我应该总是切片 *2 还是应该转换成什么?