我正在用 Node.js 编写一个应用程序,它允许用户在 twitter 等消息中相互提及。我希望能够找到用户并向他们发送通知。为了做到这一点,我需要拉 @usernames 从 node.js 中的字符串中查找提及?
任何建议,正则表达式,问题?
我正在用 Node.js 编写一个应用程序,它允许用户在 twitter 等消息中相互提及。我希望能够找到用户并向他们发送通知。为了做到这一点,我需要拉 @usernames 从 node.js 中的字符串中查找提及?
任何建议,正则表达式,问题?
我发现这是在 javascript 中查找字符串内提及的最佳方法。
var str = "@jpotts18 what is up man? Are you hanging out with @kyle_clegg";
var pattern = /\B@[a-z0-9_-]+/gi;
str.match(pattern);
["@jpotts18", "@kyle_clegg"]
我故意将其限制为大小写字母数字和 (-,_) 符号,以避免句点可能与 (@j.potts) 等用户名混淆。
这就是twitter-text.js在幕后所做的。
// Mention related regex collection
twttr.txt.regexen.validMentionPrecedingChars = /(?:^|[^a-zA-Z0-9_!#$%&*@@]|RT:?)/;
twttr.txt.regexen.atSigns = /[@@]/;
twttr.txt.regexen.validMentionOrList = regexSupplant(
'(#{validMentionPrecedingChars})' + // $1: Preceding character
'(#{atSigns})' + // $2: At mark
'([a-zA-Z0-9_]{1,20})' + // $3: Screen name
'(\/[a-zA-Z][a-zA-Z0-9_\-]{0,24})?' // $4: List (optional)
, 'g');
twttr.txt.regexen.endMentionMatch = regexSupplant(/^(?:#{atSigns}|[#{latinAccentChars}]|:\/\/)/);
如果您使用了任何更有效或更准确的方法,请告诉我。谢谢!
Twitter 有一个库,你应该可以使用它。https://github.com/twitter/twitter-text-js。
我没有使用过它,但如果你相信它的描述,“该库为 URL、用户名、列表和主题标签提供了自动链接和提取功能。”。您应该能够在带有npm install twitter-text
.
虽然我知道您不是在寻找 Twitter 用户名,但同样的逻辑仍然适用,您应该可以正常使用它(它不会验证提取的用户名是有效的 Twitter 用户名)。如果没有,为你自己的目的分叉它可能是一个很好的起点。
编辑:我仔细查看了文档,这里有一个您需要的完美示例。
var usernames = twttr.txt.extractMentions("Mentioning @twitter and @jack")
// usernames == ["twitter", "jack"]
这是使用 JavaScript 和下划线从 instagram 标题中提取提及的方法。
var _ = require('underscore');
function parseMentions(text) {
var mentionsRegex = new RegExp('@([a-zA-Z0-9\_\.]+)', 'gim');
var matches = text.match(mentionsRegex);
if (matches && matches.length) {
matches = matches.map(function(match) {
return match.slice(1);
});
return _.uniq(matches);
} else {
return [];
}
}