regex - 正则表达式查找主题标签

Question

这是给 Matlab 的。我有一条推文，我需要找到主题标签所说的内容。我知道我可以使用正则表达式隔离并保存以“#”开头并以“”结尾的所有内容。但是，当我使用

    tweet = 'it is fun to post on #stackoverflow, really #itis';
    regexp(tweet,'#(\w+)','tokens','once')
    ans = 
        'stackoverflow'

我只得到第一个#。我将如何做到这一点，以便我也可以获得“itis”＃？

score 4 · Accepted Answer

4

once仅返回第一个匹配项.... 如果您不想要，请删除它。

于 2012-12-12T23:28:45.430 回答

score 0 · Accepted Answer

根据 matlab 文档，您需要删除“一次”。资料来源： http: //www.mathworks.com/help/matlab/ref/regexp.html

score 0 · Accepted Answer

我想这就是你要找的：

regexp(tweet,'#(\w+)','match')
ans = 
'#stackoverflow'    '#itis'

但是，似乎您对 Regex 的了解比我多，所以我猜您知道如何摆脱#字符串中的 's。

3 回答 3