4

出于某种原因,pyparsing 没有为我的字符串嵌套列表:

rank = oneOf("2 3 4 5 6 7 8 9 T J Q K A")
suit = oneOf("h c d s")
card = rank + Optional(suit)

suit_filter = oneOf("z o")
hand = card + card + Optional(suit_filter)

greater = Literal("+")
through = Literal("-")
series = hand + Optional(greater | through + hand)

series_split = Literal(",")
hand_range = series + ZeroOrMore(series_split + series)

hand_range.parseString('22+,AKo-ATo,KQz')

>> ['2', '2', '+', ',', 'A', 'K', 'o', '-', 'A', 'T', 'o', ',', 'K', 'Q', 'z']

我不确定为什么 pyparsing 没有在 22+、AKo-ATo 和 KQz(或任何比这更深的层)周围创建列表。我错过了什么?

4

1 回答 1

8

Pyparsing 没有对这些标记进行分组,因为你没有告诉它。Pyparsing 的默认行为是将所有匹配的标记简单地串在一起形成一个列表。要对标记进行分组,请将要在 pyparsingGroup表达式中分组的解析器中的表达式包装起来。在您的情况下,更改series为:

series = hand + Optional(greater | through + hand)

series = Group(hand + Optional(greater | through + hand))

另外,我建议您不要像在 中那样实现自己的逗号分隔列表series,而是使用 pyparsing 帮助器,delimitedList

hand_range = delimitedList(series)

delimitedList假定逗号分隔符,但任何字符(甚至完整的 pyparsing 表达式)都可以作为delim参数给出。定界符本身在结果中被抑制,因为delimitedList假设定界符只是作为重要位(列表元素)之间的分隔符而存在。

进行这两项更改后,解析结果现在开始看起来更像您所要求的:

[['2', '2', '+'], ['A', 'K', 'o', '-', 'A', 'T', 'o'], ['K', 'Q', 'z']]

我猜您可能还想提出Group定义hand,以构建这些结果。

如果这是一个将以某种方式评估的表达式(例如扑克牌),那么请查看 pyparsing wiki 上的这些示例,这些示例使用类作为解析操作来构造可以评估等级或布尔值或其他对象的对象.

http://pyparsing.wikispaces.com/file/view/invRegex.py

http://pyparsing.wikispaces.com/file/view/simpleBool.py

http://pyparsing.wikispaces.com/file/view/eval_arith.py

如果为这些表达式构造对象,则不需要使用Group.

于 2010-11-20T06:51:34.073 回答