0

我正在尝试实现用于解析 lucene 查询的语法。到目前为止,一切都很顺利,直到我尝试添加对范围查询的支持。除了我的语法之外,Lucene 的详细信息如下所示:

grammar ModifiedParser;

TERM_RANGE : '[' ('*' | TERM_TEXT) 'TO' ('*' | TERM_TEXT) ']'
           | '{' ('*' | TERM_TEXT) 'TO' ('*' | TERM_TEXT) '}'
           ;

query : not (booleanOperator? not)* ;

booleanOperator : andClause
                | orClause
                ;

andClause : 'AND' ;
notClause : 'NOT' ;
orClause  : 'OR' ;

not : notClause? MODIFIER? clause;

clause : unqualified                        
       | qualified                          
       ;

unqualified : TERM_RANGE                   # termRange
            | TERM_PHRASE                  # termPhrase
            | TERM_PHRASE_ANYTHING         # termTruncatedPhrase
            | '(' query ')'                # queryUnqualified
            | TERM_TEXT_TRUNCATED          # termTruncatedText
            | TERM_NORMAL                  # termText
            ;

qualified : TERM_NORMAL ':' unqualified                  
          ;

fragment TERM_CHAR  : (~(' ' | '\t' | '\n' | '\r' | '\u3000'
                    | '\'' | '\"' | '(' | ')' | '[' | ']' | '{' | '}'
                    | '+' | '-' | '!' | ':' | '~' | '^'
                    | '?' | '*' | '\\' ))
                    ;

fragment TERM_START_CHAR : TERM_CHAR
                         | ESCAPE
                         ;

fragment ESCAPE : '\\' ~[];

MODIFIER : '-'
         | '+'
         ;

AND : 'AND';
OR : 'OR';
NOT : 'NOT';

TERM_PHRASE_ANYTHING : '"'  (ESCAPE|~('\"'|'\\'))+  '"' ;
TERM_PHRASE          : '"' (ESCAPE|~('\"'|'\\'|'?'|'*'))+ '"' ;
TERM_TEXT_TRUNCATED : ('*'|'?')(TERM_CHAR+ ('*'|'?'))+ TERM_CHAR*
                    | TERM_START_CHAR (TERM_CHAR* ('?'|'*'))+ TERM_CHAR+
                    | ('?'|'*') TERM_CHAR+
                    ;  

TERM_NORMAL : TERM_TEXT;                                            

fragment TERM_TEXT : TERM_START_CHAR TERM_CHAR* ;

WS : [ \t\r\n] -> skip ;

当我尝试访问访问者并使用标记时,显然解析将asd [ 10 TO 100 ] { 1 TO 1000 } 100..1000引发标记识别错误[,并且仅尝试访问第三个范围内的规则。你们知道我在这里想念什么吗?提前致谢]}{termRange

4

1 回答 1

1

由于您制定TERM_RANGE了词法分析器规则,因此您必须在字符级别考虑所有内容。特别是,您忘记在输入中允许空白字符。

termRange如果您改为创建解析器规则,您可能会处于更好的位置。

于 2013-09-05T17:03:03.073 回答