我有一张像下面这样的表格,想计算存在的不同因素组合。例如,所有人都在场的次数(1 表示存在,0 表示不存在)。第一时间不存在但休息存在,第二时间不存在但其他时间存在,以及双打和三打不存在且休息存在。
在 shell 中,检查所有人都存在的时间非常简单
awk '{if (($2 == 1) && ($3==1) && ($4==1) && ($5==1) && ($6==1)) 打印 $1}'ALL_Freq_motif_AE_Uper
但问题是计算所有可能的组合。
该表如下所示:
CEBP HEB TAL1 RUNX1 SPI1
1 1 1 1 1
0 1 1 1 1
1 1 0 0 1
1 1 1 1 0
0 0 0 1 1
现在从这张表中产生了不同的组合
1 个组合,所有都存在。
2 第一个缺席,所有其他人都在
3 最后一个缺席,但其他人在场
4 第三和第四人缺席,但其他人在场
5 前三个人缺席,但其他人在场。
在像这样具有固定列数和 n 行数的表中,我如何计算存在和不存在的这些组合?
请帮忙。
谢谢