对于一个研究项目,我使用以下 ANTLR 语法来解析包含一些简单布尔运算符(如 AND、NOT 等)的查询字符串:
grammar SimpleBoolean;
options { language = CSharp2; output = AST; }
tokens { AndNode; }
@lexer::namespace { INR.Infrastructure.QueryParser }
@parser::namespace { INR.Infrastructure.QueryParser }
LPARENTHESIS : '(';
RPARENTHESIS : ')';
AND : 'AND';
OR : 'OR';
ANDNOT : 'ANDNOT';
NOT : 'NOT';
PROX : **?**
fragment CHARACTER : ('a'..'z'|'A'..'Z'|'0'..'9'|'ä'|'Ä'|'ü'|'Ü'|'ö'|'Ö');
fragment QUOTE : ('"');
fragment SPACE : (' '|'\n'|'\r'|'\t'|'\u000C');
WS : (SPACE) { $channel=Hidden; };
WORD : (~( ' ' | '\t' | '\r' | '\n' | '/' | '(' | ')' ))*;
PHRASE : (QUOTE)(CHARACTER)+((SPACE)+(CHARACTER)+)+(QUOTE);
startExpression : andExpression;
andExpression : (andnotExpression -> andnotExpression) (AND? a=andnotExpression -> ^(AndNode $andExpression $a))*;
andnotExpression : orExpression (ANDNOT^ orExpression)*;
proxExpression : **?**
orExpression : notExpression (OR^ notExpression)*;
notExpression : (NOT^)? atomicExpression;
atomicExpression : PHRASE | WORD | LPARENTHESIS! andExpression RPARENTHESIS!;
现在我想为所谓的邻近查询添加一个运算符。例如,查询"A /5 B"
应该返回所有包含 A 和 B 在接下来的 5 个单词内的所有内容。当然,数字 5 可以是任何其他正整数。换句话说,邻近查询应该产生以下语法树:
http://graph.gafol.net/pic/ersaDEbBJ.png
不幸的是,我不知道如何(在语法上)将这样的“PROX”运算符添加到我现有的 ANTLR 语法中。任何帮助表示赞赏。谢谢!