我正在使用 Python 来处理微博(中国类似推特的服务)句子。句子中有一些表情符号,对应的unicode是\ue317
etc。为了处理句子,我需要用gbk对句子进行编码,见下图:
string1_gbk = string1.decode('utf-8').encode('gb2312')
会有一个UnicodeEncodeError:'gbk' codec can't encode character u'\ue317'
我试过\\ue[0-9a-zA-Z]{3}
了,但没有用。我如何在句子中匹配这些表情符号?