1

我已经从YouTube视频中抓取了标题。我已将其简化为类似于以下的字符串:

string1 = "Red~VS~Blue";
string2 = "oRange v wHite";
string3 = "black knights verses purple people";

team0 = string.split(regexp)[0];
team1 = string.split(regexp)[1];

我正在尝试使用 Javascript 的string.split方法将每个字符串分解为两个团队名称的数组。空格或分隔符是否通过并不重要,因为它们可以在以后轻松清理。我还希望正则表达式具有一些基本的拼写错误捕获功能。

常用表达:

regexp = /\Wv(s|\W)/i; \\Should match " v " or " vs", gives 3 results instead of 2
regexp = /\Wv[s\W]/i; \\Works as I thought the above should 
regexp = /\W(vs|v\W|vers[eu]s)/i \\attempt at dealing with typos, doesn't work

当我添加更多括号()而不是包含我写的任何内容时,它往往会在拆分中添加额外的结果。我已经在这里这里阅读了这些关于正则表达式的教程以及关于stackoverflow的一些答案,但我找不到任何相关的内容来帮助我。我该如何解决这个问题?

4

1 回答 1

3
result = subject.split(/\W+v(?:ers[ue])?s?\W+/i);

正确拆分所有示例字符串。

解释:

\W+        # Match one or more non-word characters
v          # Match v
(?:        # followed by
 ers[ue]   # ersu or erse
)?         # (optionally)
s?         # followed by s (optionally)
\W+        # Match one or more non-word characters

不过,这也匹配versuor verse

于 2012-09-17T07:43:08.640 回答