任何想法,如果可以使用正则表达式(python 2.7)将uniq chars unspitted 成unicode graphemes 的代理对?
根据此示例,这可以通过 python 3.x 实现。看这里:
>>> import regex
>>> s = ''
>>> for c in regex.findall('\X',s):
... print(c)
...
但对于 python 2.7,它似乎不起作用。参见示例:
>>> import regex
>>> s = ''
>>> for c in regex.findall('\X',s):
... print(c)
�
�
�
�
�
�
�
�
...
任何想法如何使它适用于python 2.7?=))))
提前谢谢你!!!=)