19

我正在用 Node.js 编写一个应用程序,它允许用户在 twitter 等消息中相互提及。我希望能够找到用户并向他们发送通知。为了做到这一点,我需要拉 @usernames 从 node.js 中的字符串中查找提及?

任何建议,正则表达式,问题?

4

3 回答 3

47

我发现这是在 javascript 中查找字符串内提及的最佳方法。

var str = "@jpotts18 what is up man? Are you hanging out with @kyle_clegg";
var pattern = /\B@[a-z0-9_-]+/gi;
str.match(pattern);
["@jpotts18", "@kyle_clegg"]

我故意将其限制为大小写字母数字和 (-,_) 符号,以避免句点可能与 (@j.potts) 等用户名混淆。

这就是twitter-text.js在幕后所做的。

// Mention related regex collection
twttr.txt.regexen.validMentionPrecedingChars = /(?:^|[^a-zA-Z0-9_!#$%&*@@]|RT:?)/;
twttr.txt.regexen.atSigns = /[@@]/;
twttr.txt.regexen.validMentionOrList = regexSupplant(
    '(#{validMentionPrecedingChars})' +  // $1: Preceding character
    '(#{atSigns})' +                     // $2: At mark
    '([a-zA-Z0-9_]{1,20})' +             // $3: Screen name
    '(\/[a-zA-Z][a-zA-Z0-9_\-]{0,24})?'  // $4: List (optional)
  , 'g');
twttr.txt.regexen.endMentionMatch = regexSupplant(/^(?:#{atSigns}|[#{latinAccentChars}]|:\/\/)/);

如果您使用了任何更有效或更准确的方法,请告诉我。谢谢!

于 2013-03-07T07:39:19.900 回答
6

Twitter 有一个库,你应该可以使用它。https://github.com/twitter/twitter-text-js

我没有使用过它,但如果你相信它的描述,“该库为 URL、用户名、列表和主题标签提供了自动链接和提取功能。”。您应该能够在带有npm install twitter-text.

虽然我知道您不是在寻找 Twitter 用户名,但同样的逻辑仍然适用,您应该可以正常使用它(它不会验证提取的用户名是有效的 Twitter 用户名)。如果没有,为你自己的目的分叉它可能是一个很好的起点。

编辑:我仔细查看了文档,这里有一个您需要的完美示例。

var usernames = twttr.txt.extractMentions("Mentioning @twitter and @jack")
// usernames == ["twitter", "jack"]
于 2013-03-07T17:54:26.367 回答
0

这是使用 JavaScript 和下划线从 instagram 标题中提取提及的方法。

var _ = require('underscore');

function parseMentions(text) {
    var mentionsRegex = new RegExp('@([a-zA-Z0-9\_\.]+)', 'gim');

    var matches = text.match(mentionsRegex);
    if (matches && matches.length) {
        matches = matches.map(function(match) {
            return match.slice(1);
        });
        return _.uniq(matches);
    } else {
        return [];
    }
}
于 2015-09-10T12:30:22.830 回答