3

下面是一个正则表达式,它从 JS 字符串中挑选出相关的标记来构造一个 s 表达式。紧随其后的是一个巨大的块注释,记录了它是如何构建的。我包括它是因为我是正则表达式的新手,也许我不理解其中的一点。 我不明白为什么每个匹配 regex.exec() 返回的匹配应该是重复两次并分组为列表的相同匹配?

var tx = /\s*(\(|\)|[^\s()]+|$)/g; // Create a regular expression
/*       /1 234  5  6      7   /global search
        1. \s      : whitespace metacharacter
        2. n*      : matches any string that contains zero or more 
                     occurrences of n
        3. (a|b|c) : find any of the alternatives specified
        4. \(      : escaped open paren, match "(" (since parens are reserved 
                     characters in regex)
        5. \)      : escaped close paren, match ")"
        6. [^abc]  : find any character not between the brackets
        7. n+      : matches any string that contains at least one n
RESULT - Find matches that have zero or more leading whitespace characters (1+2) 
that are one of the following (3): open paren (4) -OR- close paren (5)
-OR- any match that is at least one non-whitespace, non-paren character (6+7) 
-OR- $, searching globally to find all matches */

var textExpression = "(1 2 3)";
var execSample;
for(var i =0; i < textExpression.length; i++){
    execSample = tx.exec(textExpression)
    display( execSample );
}

这是打印的内容:

(,(
1,1
 2,2
 3,3
),)
,
null

为什么匹配作为列表重复?

4

2 回答 2

3

您在打印的列表中没有得到完全相同的项目。

  • 第一个具有相同的空间,代表$0
  • 第二个是没有空格的文本,代表$1

如果您将正则表达式更改为:

var tx = /\s*(?:\(|\)|[^\s()]+|$)/g;

然后您将在打印列表中获得单个项目。

于 2013-10-31T17:46:45.960 回答
2

这是因为您的正则表达式中有括号中的组。该.exec()函数返回一个数组。在数组中,第一个元素(元素 0)将包含整个匹配项,然后后续元素包含匹配的组。

如果你不想这样,你可以使用非捕获组:

var tx = /\s*(?:\(|\)|[^\s()]+|$)/g; 
于 2013-10-31T17:46:53.930 回答