我有一个编码问题,超出了我对 unix 电动工具的有限技能。我希望用以下任一方法计算样本数量:i)基因中的纯合变体(下面的 BB);或 ii) 基因中的两个变体 (2x AB)。例如,来自:
Variant Gene Sample1 Sample2 Sample3
1 TP53 AA BB AB
2 TP53 AB AA AB
3 TP53 AB AA AA
4 KRAS AA AB AA
5 KRAS AB AB BB
我在找:
Gene Two_variants Homozygous Either
TP53 2 1 3
KRAS 1 1 2
任何帮助将非常感激。谢谢。
R_G