1

我正在尝试使用正则表达式来匹配特定模式并删除整个模式。例如:“在此处留下≺随机文字≻其他文字”

我需要它以这样的“离开其他测试”结束。现在我将我的脚本转换为使用 unicode,但它拒绝在列表中找到字符串。

我试图根据文字值调用它,它也是十六进制替代(使用十六进制编辑器找到符号的确切十六进制代码,utf-8 符号)。

请记住,“≻”与“>”不同。

试过:

eleInfo = "Leave ≺random text here≻Other text"

eleInfo = re.sub("≺.*?≻","",eleInfo)

试过:

eleInfo = "Leave ≺random text here≻Other text"

eleInfo = re.sub("\x89\xBA.*?\x89\xBB","",eleInfo)

试过:

eleInfo = "Leave ≺random text here≻Other text"

eleInfo = re.sub("\\x89\\xBA.*?\\x89\\xBB","",eleInfo)

任何帮助或想法将不胜感激!

4

1 回答 1

0

看起来您缺少\xe2。以下作品:

re.sub("\\xe2\\x89\\xba.*\\xe2\\x89\\xbb","",eleInfo)

此外,您可以将字符串转换为 unicode 。

eleInfo = unicode("Leave ≺random text here≻Other text")

re.sub(u"[\u227a].*[\u227b]","",eleInfo) works too.
于 2013-07-27T01:38:55.213 回答