我有一个关于如何为正则表达式实现可选部分的问题。我以解析古老的文本冒险输入为例。这很好地突出了我的任务。这是一个显示我所追求的示例:
var exp = /^([a-z]+)(?:\s([a-z0-9\s]+)\s(on|with)\s([a-z\s]+))?$/i;
var strings = [
"look",
"take key",
"take the key",
"put key on table",
"put the key on the table",
"open the wooden door with the small rusty key"
];
for (var i=0; i < strings.length;i++) {
var match = exp.exec(strings[i]);
if (match) {
var verb = match[1];
var directObject = match[2];
var preposition = match[3];
var indirectObject = match[4];
console.log("String: " + strings[i]);
console.log(" Verb: " + verb);
console.log(" Direct object: " + directObject);
console.log(" Preposition: " + preposition);
console.log(" Indirect object: " + indirectObject);
} else {
console.log("String is not a match: " + strings[i]);
}
console.log(match);
}
我的正则表达式适用于第一个和最后三个字符串。
我知道如何使用其他方法(如 .split())获得正确的结果。这是学习正则表达式的尝试,所以我不是在寻找另一种方法来做到这一点:-)
我尝试添加更多可选的非捕获组,但我无法让它工作:
var exp = /^([a-z]+)(?:\s([a-z0-9\s]+)(?:\s(on|with)\s([a-z\s]+))?)?$/i;
这适用于前三个字符串,但不适用于最后三个。
所以我想要的是:第一个单词,一些字符直到指定的单词(比如“on”),一些字符直到字符串结尾
棘手的部分是不同的变体。
可以做到吗?
工作解决方案:
exp = /^([a-z]+)(?:\s((?:(?!\s(?:on|with)).)*)(?:\s(on|with)\s(.*))?)?$/i;