我正在为 facebook 编写一个主题标签抓取工具,我遇到的每个获取主题标签的正则表达式似乎都包含标点符号和字母数字字符。这是我想要的一个例子:
你好世界!我是#m4king 一个#fac_book 刮刀,想要一个不错的正则#expression。
我希望它匹配world
, m4king
, fac
and expression
(请注意,如果它到达标点符号,我希望它被切断,包括空格)。如果它不包含井号就好了,但这并不是非常重要。
以防万一它很重要,我将使用 ruby 的字符串扫描方法来抓取可能多个标签。
提前致谢!