对于以下数据,我想使用等位基因变量重新编码其余数据,如下所示:如果特定行的变量等位基因中的第一个字母以 A 开头,则仅将该行的所有 A 替换为 1。如果该行在特定行的可变等位基因中以 G 开头,则仅将该行的所有 G 替换为 1。如果在特定行的变量等位基因中以 C 开头的行以 T 开头,则仅将该行的所有 T 替换为 1 。然后将 H 替换为 0 (在所有数据帧中),其余字母( AGCT )用 -1 替换所有数据帧。
alleles x1 x2 x3 x4
1 A/G G G G G
2 A/G G G G G
3 A/C C N N C
4 C/T T N N T
5 C/G N C C H
6 C/G C N N C
7 C/T C C T C
8 A/G G G A G
9 A/G N N A A
10 A/G G G N G
11 C/T N C C C
12 A/G N A A A