1

这是给 Matlab 的。我有一条推文,我需要找到主题标签所说的内容。我知道我可以使用正则表达式隔离并保存以“#”开头并以“”结尾的所有内容。但是,当我使用

    tweet = 'it is fun to post on #stackoverflow, really #itis';
    regexp(tweet,'#(\w+)','tokens','once')
    ans = 
        'stackoverflow'

我只得到第一个#。我将如何做到这一点,以便我也可以获得“itis”#?

4

3 回答 3

4

once仅返回第一个匹配项.... 如果您不想要,请删除它。

于 2012-12-12T23:28:45.430 回答
0

根据 matlab 文档,您需要删除“一次”。资料来源: http: //www.mathworks.com/help/matlab/ref/regexp.html

于 2012-12-12T23:31:01.480 回答
0

我想这就是你要找的:

regexp(tweet,'#(\w+)','match')
ans = 
'#stackoverflow'    '#itis'

但是,似乎您对 Regex 的了解比我多,所以我猜您知道如何摆脱#字符串中的 's。

于 2012-12-13T09:41:16.130 回答