1

我有一条推文,我需要找到主题标签所说的内容。如何使用正则表达式隔离并保存以“#”开头并以“”结尾的所有内容?我正在使用 MatLab。

4

1 回答 1

5

当您不熟悉正则表达式时,使用起来可能会很困难。

这是查找主题标签的一种方法:

tweet = 'it is fun to post on #stackoverflow, really';
regexp(tweet,'#(\w+)','tokens','once')
ans = 
    'stackoverflow'

做什么#(\w+)?我们用 来查看“单词”字符(没有空格,没有标点符号)\w,并指定我们至少需要其中一个+。单词必须以 . 开头#。我们使用括号来指示我们想要返回哪个部分,以及tokens返回匹配项的选项(我不在乎主题标签在推文中的位置)。我设置了选项once,以便regexp只查找一个主题标签;如果您希望推文中有多个主题标签,请不要这样做,但请注意输出将是一个字符串元胞数组。

于 2012-12-11T22:57:34.077 回答