4

我有一个关于如何为正则表达式实现可选部分的问题。我以解析古老的文本冒险输入为例。这很好地突出了我的任务。这是一个显示我所追求的示例:

var exp = /^([a-z]+)(?:\s([a-z0-9\s]+)\s(on|with)\s([a-z\s]+))?$/i;

var strings = [
    "look",
    "take key",
    "take the key",
    "put key on table",
    "put the key on the table",
    "open the wooden door with the small rusty key"
];

for (var i=0; i < strings.length;i++) {
    var match = exp.exec(strings[i]);

    if (match) {
        var verb = match[1];
        var directObject = match[2];
        var preposition = match[3];
        var indirectObject = match[4];

        console.log("String: " + strings[i]);
        console.log("  Verb: " + verb);
        console.log("  Direct object: " + directObject);
        console.log("  Preposition: " + preposition);
        console.log("  Indirect object: " + indirectObject);    
    } else {
        console.log("String is not a match: " + strings[i]);
    }
    console.log(match);
}

我的正则表达式适用于第一个和最后三个字符串。

我知道如何使用其他方法(如 .split())获得正确的结果。这是学习正则表达式的尝试,所以我不是在寻找另一种方法来做到这一点:-)

我尝试添加更多可选的非捕获组,但我无法让它工作:

var exp = /^([a-z]+)(?:\s([a-z0-9\s]+)(?:\s(on|with)\s([a-z\s]+))?)?$/i;

这适用于前三个字符串,但不适用于最后三个。

所以我想要的是:第一个单词,一些字符直到指定的单词(比如“on”),一些字符直到字符串结尾

棘手的部分是不同的变体。

可以做到吗?

工作解决方案:

exp = /^([a-z]+)(?:\s((?:(?!\s(?:on|with)).)*)(?:\s(on|with)\s(.*))?)?$/i;
4

1 回答 1

2

也许像这样的一些正则表达式:

var exp = /^([a-z]+)(?:(?:(?!\s(?:on|with))(\s[a-z0-9]+))+(?:\s(?:on|with)(\s[a-z0-9]+)+)?)?$/i;

该组\s[a-z0-9]+捕获前面有空格的单词。

(?!\s(?:on|with))避免这个词是“on”或“with”。

因此(?:(?!\s(?:on|with))(\s[a-z0-9]+))+是“on”或“with”之前的单词列表。

你可以在这里测试。

于 2012-12-03T14:31:20.477 回答