我正在尝试使用正则表达式来捕获至少两次包含子字符串的推文,所以我使用的是简单的
^.+ .+ .+$
. 但是,这与包含的字符串不匹配,例如.
有没有一种聪明的方法可以捕捉任何或没有肤色变化的表情符号,而无需将每个表情符号排成一行(如[]
)?
我正在尝试使用正则表达式来捕获至少两次包含子字符串的推文,所以我使用的是简单的
^.+ .+ .+$
. 但是,这与包含的字符串不匹配,例如.
有没有一种聪明的方法可以捕捉任何或没有肤色变化的表情符号,而无需将每个表情符号排成一行(如[]
)?
多亏了上面的评论,我发现我在 twitter 上遇到的表情符号是 unicode,并且肤色变化是组合范围内的字符1f3fb
-<code>1f3ff。
http://unicode.org/reports/tr51/#Emoji_Modifiers_Table
所以对我来说,我想要的是[\x{1f3fb}-\x{1f3ff}]?
,[\x{1f3fb}-\x{1f3ff}]?
我可以放在任何未经修改的表情符号旁边,以包括肤色变化。