给定一个包含许多列的表
|-------|-------|-------|-------|
| A | B | .. | N |
|-------|-------|-------|-------|
| 1 | 0 | .. | X |
| 2 | 0 | .. | Y |
| .. | .. | .. | .. |
|-------|-------|-------|-------|
迭代所有列组合(所有长度)并执行 GROUP BY 操作的最有效方法是什么?作为表和esp。组合可以很大 (2^n),最好有GPU 支持。
colnames = df.columns
for L in range(2,len(colnames)):
for comb in itertools.combinations(colnames, L):
dfg = df.groupby(comb, sort=False).size().reset_index().rename(columns={0:'count'})