是否有任何用于从 instagram 媒体标题中提取主题标签和用户提及的 Java 库或正则表达式模式?我知道 twitter-text api,但它无法处理没有空间标签。
问问题
1460 次
1 回答
1
这个应该可以工作(^|\s)(#[a-z\d-]+)
(从这里得到)
无论如何,如果您使用的是 Instagram API,当您调用它时,结果的一部分会为您提供所有主题标签:
["data"]=>
array(14) {
["attribution"]=>
NULL
["tags"]=>
array(3) {
[0]=>
string(13) "workingermany"
[1]=>
string(18) "trabajarenalemania"
[2]=>
string(10) "radeberger"
}
如果按照您的评论要求,您需要韩语字符,只需将它们添加到正则表达式中,如下所示:(^|\s)(#[a-z\p{Hangul}\d-]+)
您想要的字母越多,您应该添加的字符集越多,例如\p{Hiragana}
, \p{Katakana}
, 或\p{Latin}
于 2016-03-07T09:04:52.543 回答