我有一组元组。例如:
set([(('E', ('T',)), 0),
(('F', ('(', 'E', ')')), 0),
(('T', ('F',)), 0),
(('__S__', ('E', '$')), 0),
(('E', ('E', '+', 'T')), 0),
(('T', ('T', '*', 'F')), 0),
(('F', ('id',)), 0)])
如您所见,每个元组都有一个元组作为第一个元素(例如 ('F', ('(', 'E', ')')) )。
该元组的第一个元素是单个字符,第二个元素是另一个元组(例如 ('(', 'E', ')')) )。这个元组中有一个或多个单个字符。
(它实际上是上下文无关语法。第一个元素是规则(头)的 LHS,第二个元组是 RHS(正文)
每个元组的第二个元素中的数字是指向该语法的 RHS 中的一个字符的指针。
我在尝试什么要做的是根据已指向的元素对这些元组进行分组。
为此,我编写了以下代码:
import itertools
S = set([(('E', ('T',)), 0), (('F', ('(', 'E', ')')), 0), (('T', ('F',)), 0), (('__S__', ('E', '$')), 0), (('E', ('E', '+', 'T')), 0), (('T', ('T', '*', 'F')), 0), (('F', ('id',)), 0)])
for v, h in itertools.groupby(S, lambda x: x[0][1][x[1]] if len(x[0][1]) > x[1] else None ):
if (v is None):
continue
print '--'
print v
for hi in h:
print hi
如果 x[0][1][x[1]] 相同,则两个元组在同一组中。x[0][1] 是第一个元组的第二个元组(语法的 RHS),x[1] 是指针。
我得到以下结果:
--
(
(('F', ('(', 'E', ')')), 0)
--
F
(('T', ('F',)), 0)
--
E
(('__S__', ('E', '$')), 0)
--
T
(('T', ('T', '*', 'F')), 0)
--
id
(('F', ('id',)), 0)
--
T
(('E', ('T',)), 0)
--
E
(('E', ('E', '+', 'T')), 0)
如您所见,有两组键为“T”。我不明白我在这里做错了什么!
我几乎是新的python程序员。万一问题太傻了!
谢谢!