python - 基于 GPU 的组合解析器与表分组操作

问问题 2020-05-23T16:33:30.337

194 次

给定一个包含许多列的表

|-------|-------|-------|-------|
|   A   |   B   |  ..   |   N   |
|-------|-------|-------|-------|
|   1   |   0   |  ..   |   X   |
|   2   |   0   |  ..   |   Y   |
|  ..   |  ..   |  ..   |  ..   |
|-------|-------|-------|-------|

迭代所有列组合（所有长度）并执行 GROUP BY 操作的最有效方法是什么？作为表和esp。组合可以很大 (2^n)，最好有GPU 支持。

 colnames = df.columns
 for L in range(2,len(colnames)):
   for comb in itertools.combinations(colnames, L):
     dfg = df.groupby(comb, sort=False).size().reset_index().rename(columns={0:'count'})

python - 基于 GPU 的组合解析器与表分组操作

0 回答 0

Related

Reference