是否可以使用 ANTLR4 从规则中提取第一组和后一组?我在 ANTLR3 中对此进行了一些尝试,但没有找到令人满意的解决方案,但如果有人有任何版本的信息,将不胜感激。
我想解析用户输入的用户光标位置,然后提供自动完成的可能选择列表。目前,我对部分输入的自动完成令牌不感兴趣。我想在解析中间的某个时候显示所有可能的后续标记。
例如:
sentence:
subjects verb (adverb)? '.' ;
subjects:
firstSubject (otherSubjects)* ;
firstSubject:
'The' (adjective)? noun ;
otherSubjects:
'and the' (adjective)? noun;
adjective:
'small' | 'orange' ;
noun:
CAT | DOG ;
verb:
'slept' | 'ate' | 'walked' ;
adverb:
'quietly' | 'noisily' ;
CAT : 'cat';
DOG : 'dog';
鉴于上述语法...
如果用户尚未键入任何内容,则自动完成列表将是 ['The'] (请注意,我必须检索规则语句的 FIRST 而不是 FOLLOW,因为基本规则的后续始终是 EOF)。
如果输入是“The”,则自动完成列表将为 ['small', 'orange', 'cat', 'dog']。
如果输入是“猫睡着了,那么自动完成列表将是 ['quietly', 'noisily', '.']。
所以 ANTLR3 提供了一种方法来获得以下集合:
BitSet followSet = state.following[state._fsp];
这很好用。我可以将一些逻辑嵌入到我的解析器中,这样当解析器调用用户所在的规则时,它会检索该规则的后续内容,然后将它们提供给用户。但是,这不适用于嵌套规则(例如,基本规则,因为跟随集忽略并且子规则遵循,因为它应该)。
如果用户已经完成了一条规则(这可能很难确定),我认为我需要提供 FIRST 集以及 FOLLOW 集以涵盖所有有效选项。我还认为我需要构造我的语法,以便在规则级别上永远不会出现两个标记。
我会把上面的“firstSubject”规则分解成一些子规则......
从
firstSubject:
'The'(adjective)? CAT | DOG;
至
firstSubject:
the (adjective)? CAT | DOG;
the:
'the';
我还没有找到任何有关从规则中检索第一组的信息。
ANTLR4 似乎在生成的解析器级别上彻底改变了它的工作方式,所以在这一点上,我不确定是否应该继续使用 ANTLR3 或跳转到 ANTLR4。
任何建议将不胜感激。