我需要一个仅从文本文件中获取重要标记部分的解析器。这是示例输入:
else before 1
else before 2
--Start Query 1
important 1
--End 1
else between 1 and 2 - 1
else between 1 and 2 - 2
--Start Query 2
important 2
--End 2
else after1-1
else after1-2
我写了这个解析器:
public class ExpressionDefinition extends GrammarDefinition {
{
def("start", ref("expr").star().end());
def("nl", of("\r\n").or(of("\n").or(of("\r"))));
def("expr",
ref("else").starLazy(ref("expr_start").flatten())
.seq(ref("expr_start"))
.seq(ref("expr_body"))
.seq(ref("expr_end"))
.seq(ref("else").starLazy(ref("expr_start")).optional()).map(in -> {
if (in instanceof List) {
for (Object o: (List)in) {
if (o instanceof Body) {
return o;
}
}
}
return null;
}));
def("expr_start", of("--Start Query").seq(any().starLazy(ref("nl")), ref("nl")));
def("expr_body", any().starLazy(ref("expr_end")).flatten().map((String in) -> new Body(in)));
def("expr_end", of("--End").seq(any().starLazy(ref("nl")).optional(), ref("nl").optional()));
def("else", any().starLazy(ref("nl")).seq(ref("nl")));
}
使用这个小实用程序 Pojo 来获取重要数据:
@Data
@AllArgsConstructor
public static class Body {
private final String val;
@Override public String toString() { return val; }
}
像这样运行:
ExpressionDefinition def = new ExpressionDefinition();
Parser parser = def.build();
Result result = parser.parse(input);
它给了我一个例外:
org.petitparser.context.ParseError: end of input expected
但没有明显的原因,因为最后一行是else
一种内容,我们希望它具有星级条件,它是以下内容的一部分expr
:ref("else").starLazy(ref("expr_start")).optional()
我如何更改解析器,所以它会期望 et 的结尾在输入的末尾expr
有else
或没有可能的换行符?使else
贪婪使它消耗第二个expr_body
。使其any().optional()
导致无限循环挂起。有什么解决办法吗?