1

是否有任何用于从 instagram 媒体标题中提取主题标签和用户提及的 Java 库或正则表达式模式?我知道 twitter-text api,但它无法处理没有空间标签。

4

1 回答 1

1

这个应该可以工作(^|\s)(#[a-z\d-]+)(从这里得到)

无论如何,如果您使用的是 Instagram API,当您调用它时,结果的一部分会为您提供所有主题标签:

  ["data"]=>
  array(14) {
    ["attribution"]=>
    NULL
    ["tags"]=>
    array(3) {
      [0]=>
      string(13) "workingermany"
      [1]=>
      string(18) "trabajarenalemania"
      [2]=>
      string(10) "radeberger"
    }

如果按照您的评论要求,您需要韩语字符,只需将它们添加到正则表达式中,如下所示:(^|\s)(#[a-z\p{Hangul}\d-]+) 您想要的字母越多,您应该添加的字符集越多,例如\p{Hiragana}, \p{Katakana}, 或\p{Latin}

于 2016-03-07T09:04:52.543 回答