0

我想知道如何从 twitter 的抓取推文列表中删除所有 @mentions、#hashtags 和 URL http....。

我已经尝试(但失败)使用:

find all [@].* and replace with blank
find all [#].* and replace with blank
find all [http].* and replace with blank

等等等等......这刚刚完成从我的抓取结果中删除了几乎所有内容。

我是记事本的新手,正在尝试整理所有信息。

提前致谢

4

1 回答 1

0

你的表达太宽泛了。尝试这个:

(@|#|http)\S+

或者,根据您的正则表达式风格,您可能需要将\S(非空格)写为

(@|#|http)[^ ]+

当然,使用正则表达式,一切都是为了确切地知道你想要什么,你通常会在这个过程中弄清楚。

于 2012-07-15T16:28:55.283 回答