我想部分“折叠”一个DataFrame
/matrix 并通过对压缩值求和来保持结构完整。例如,我有这个:
CHROM POS GENE DESC JOE FRED BILLY SUSAN TONY
10 1442 LOXL4 bad 1 0 0 1 0
10 335 LOXL4 bad 1 0 0 0 0
10 3438 LOXL4 good 0 0 1 0 0
10 4819 PYROXD2 bad 0 1 0 0 0
10 4829 PYROXD2 bad 0 1 0 1 0
10 9851 HPS1 good 1 0 0 0 0
前 4 列是描述符,后 4 列是人员/观察。最终目标是计算每人每个基因的“好”和“坏”观察总数。因此,我想要这个:
GENE DESC JOE FRED BILLY SUSAN TONY
LOXL4 bad 2 0 0 1 0
LOXL4 good 0 0 1 0 0
PYROXD2 bad 0 2 0 1 0
HPS1 good 1 0 0 0 0
以下代码折叠了所有单独的观察结果(Joe、Fred 等),我怎样才能将它们分开?我还希望足够灵活,以便将来容纳更多人(保持相同的 4 个描述符列)
mytable.groupby(['GENE','DESC']).size()