1

我想在推文中找到所有主题标签。下面的代码会找到主题标签,但在打印出来时,会写出每个字母而不是实际的主题标签。

问题是我想为找到的主题标签创建链接,这现在是不可能的,因为它应该为主题标签中的每个字母创建链接。

我究竟做错了什么?

tag_regex = re.compile(r"""
       [/^#\S+$/]
       """, re.VERBOSE)

for tag in tag_regex.findall(tweet):
    print tag

结果:

#
h
a
s
h
t
a
g
1
#
h
a
s
h
t
a
g
2
4

1 回答 1

3

方括号构造了一个您不想要的字符类。此外,您不想/.../在不使用它们的语言中使用正则表达式分隔符(简单的字符串就足够了,最好是原始字符串,因此您不需要转义反斜杠)。最后,如果要查找输入字符串的子字符串,则不应使用锚点:

tag_regex = re.compile(r"#\S+")
于 2013-08-28T11:54:15.680 回答