我的问题是我有一个这样的活动数据集:
| Customer | Province | District | City | Age | No. of Order |
| -------- | ------- | -------- | -----| ----| ------- |
| A | P1 | D1 | C1 | 21 | 5 |
| B | P2 | D2 | C2 | 22 | 9 |
....
我需要找到最有影响力的客户群(通常会有>20个分类群)。例如:“来自P1 省、D1 区、25 岁的客户是最有前途的群体,因为他们贡献了 50% 的总订单,同时占我们客户群的 10%”。
我目前正在使用 Pandas 从我的所有分类特征中遍历 [2,3,4] 的所有组合,并计算每个组的销售比例,但这非常耗时
我想问是否已经有Python包可以帮助找到那种组?