0

我正在尝试在 Python 中运行以下命令:

data = "&city=Zayas de Báscones;Zayas de Báscones;"
arr = re.findall(ur'[&]{1}\w{4}=[a-zA-ZA-Za-z£€ßçÇáàâäæãåèéêëîïíìôöòóøõûüùúÿñÁÀÂÄÆÃÅÈÉÊËÎÏÍÌÔÖÒÓØÕÛÜÙÚŸÑðÐ]+(?:[\s-][a-zA-ZA-Za-z£€ßçÇáàâäæãåèéêëîïíìôöòóøõûüùúÿñÁÀÂÄÆÃÅÈÉÊËÎÏÍÌÔÖÒÓØÕÛÜÙÚŸÑðÐ]+)*',data)
x = "".join(arr)
x = x.split('&city=')
print x

结果:

['', 'Zayas de B?scones']

如何获取 unicode 字符而不是问号?我一直在尝试在字符串开头使用带有'u'字符的正则表达式模式(例如:u'pattern')以及模式之前的'ur'。

4

1 回答 1

1

如果您尝试打印x[1]

 print x[1]
 #output: Zayas de B?

现在,如果您将data字符串视为 unicode。

data = u"&city=Zayas de Báscones;Zayas de Báscones;" # set it as unicode

如果您尝试打印x[1]

print x[1]
#output: Zayas de Báscones
于 2013-11-04T17:04:03.703 回答