1

我正在尝试使用一种简单的语法来解析类似 python 的结构,这就是我可以为列表/集合提出的

list : '[' atom ( ',' atom)* ']'
set : '(' atom ( ',' atom)* ']'

atom : 'a'..'z' | 'A'..'Z'
     | '[' list ']'
     | '(' set ')'

请注意,这是在 antlr 中,我想知道它的正确性以及任何可以帮助我的资源

我确实查看了 python 的语法http://docs.python.org/reference/grammar.html但不太清楚它正在处理列表列表或列表集或集合列表等。

任何帮助将不胜感激。

4

2 回答 2

3

不太清楚它正在处理列表列表或列表集或集合列表等。

它不区分列表和集合或其他:

atom: ('(' [yield_expr|testlist_comp] ')' |
       '[' [listmaker] ']' |
       '{' [dictorsetmaker] '}' |
       '`' testlist1 '`' |
       NAME | NUMBER | STRING+)

他们处理您所描述的那种递归的方式是listmakerdictorsetmaker等最终可能包含atom. 例如:

listmaker: test ( list_for | (',' test)* [','] )
test: or_test ['if' or_test 'else' test] | lambdef
or_test: and_test ('or' and_test)*
and_test: not_test ('and' not_test)*
not_test: 'not' not_test | comparison
comparison: expr (comp_op expr)*
expr: xor_expr ('|' xor_expr)*
xor_expr: and_expr ('^' and_expr)*
and_expr: shift_expr ('&' shift_expr)*
shift_expr: arith_expr (('<<'|'>>') arith_expr)*
arith_expr: term (('+'|'-') term)*
term: factor (('*'|'/'|'%'|'//') factor)*
factor: ('+'|'-'|'~') factor | power
power: atom trailer* ['**' factor]

中间有很多;那是因为他们需要为一堆数学运算符建立优先级。然后在那里list_for,它允许为列表理解添加额外的东西。

一个更简化的示例可能如下所示:

atom: ('[' [list_or_set] ']' |
       '{' [list_or_set] '}' |
       NAME | NUMBER | STRING+)

list_or_set: atom (',' atom)* [',']

或者,如果您希望在此级别上区分列表和集合:

atom: list | set | NAME | NUMBER | STRING+
list: '[' atom (',' atom)* [','] ']'
set: '{' atom (',' atom)* [','] '}'
于 2012-04-10T01:47:24.003 回答
1

这可能更接近您所追求的:

list : '[' element ( ',' element )* ']';
set : '(' element ( ',' element )* ')';

element: list | set | atom;

alpha:  'a'..'z' | 'A'..'Z' | '_' ;
alphanum: alpha | '0'..'9';
atom : alpha alphanum*;

注意:以前从未使用过 antlr,这可能不是正确的语法。

于 2012-04-10T01:13:31.523 回答