4

我想以以下方式拆分字符串:

String s = "dotimes [sum 1 2] [dotimes [sum 1 2] [sum 1 3]]"

结果:

{"dotimes", "[sum 1 2]", "[dotimes [sum 1 2] [sum 1 3]]" 

我尝试使用这个正则表达式:

s.split("\\s(?=\\[)|(?<=\\])\\s")

但这会导致以下结果:

dotimes

[sum 1 2]

[dotimes

[sum 1 2]

[sum 1 3]]

有什么方法可以使用正则表达式以我想要的方式拆分字符串?

4

2 回答 2

0

有什么方法可以使用正则表达式以我想要的方式拆分字符串?

不,那里没有。正则表达式(如果匹配)返回您包围的字符串和子字符串(),或者如果您使用全局标志,则返回所有完整匹配项的列表。您不会获得作为其他匹配项的子项的嵌套列表。

将它与 Java 结合起来就可以了。我不懂 Java,但我会尝试用这个类似 java 的代码来解释:

Array match_children (Array input) {
    Array output;

    foreach (match in input) {
        // The most important part!
        // The string starts with "[", so it is the beginning of a new nest
        if (match.startsWith("[")) {
            // Use the same ragex as below
            Array parents = string.match(matches 'dotimes' and all between '[' and ']');

            // Now, call this same function again with the 
            match = match_children(parents);
            // This stores an array in `match`
        }

        // Store match in output list
        output.push(match);

    }

    return output;
}

String string = "dotimes [sum 1 2] [dotimes [sum 1 2] [sum 1 3]]";
// "dotimes [sum 1 2] [dotimes [sum 1 2] [sum 1 3]]"

Array parents = string.match(matches 'dotimes' and all between '[' and ']');
// "dotimes", "[sum 1 2]", "[dotimes [sum 1 2] [sum 1 3]]"
// Make sure to use a global flag

Array result = match_children(Array input);
// dotimes
// [
//      sum 1 2
// ]
// [
//  dotimes
//  [
//      sum 1 2
//  ]
//  [
//      sum 1 3
//  ]
// ]

同样,我不了解 Java,如果需要更多说明,请发表评论。:) 希望这可以帮助。

于 2013-10-11T14:34:30.937 回答
0

这很有效,虽然不是特别漂亮,并且在没有来自 OP 的正式语法的情况下,它的泛化性能可能会很差。

{
    //String s = "sum 1 2";
    String s = "dotimes [sum 1 2] [dotimes [sum 1 2] [sum 1 3]]";
    int depth = 0;
    int pos = 0;        
    for (int c = 0; c <= s.length(); ++c){
        switch (c == s.length() ? ' ' : s.charAt(c)){
        case '[':
            if (++depth == 1){
                pos = c;
            }
            break;
        case ' ':
            if (depth == 0){
                String token = s.substring(pos, c == s.length() ? c : c + 1);
                if (!token.matches("\\s*")){ /*ingore white space*/
                    System.out.println(token);
                }                            
                pos = c + 1;
            }
            break;
        case ']':
            if (--depth == 0){
                String token = s.substring(pos, c + 1);
                if (!token.matches("\\s*")){ /*ingore white space*/
                    System.out.println(token);
                }                                                        
                pos = c + 1;
            }
        break;
        }
    }        
}

它将拆分字符串写入标准输出;随意添加到您喜欢的容器中。

于 2013-10-11T14:43:08.890 回答