我有一个这种格式的大型数据集
HF TLLL A T 0.999 NA 0.666 NA 0.566 NA NA 0.87
HF TLLM A T 0.500 0.500 0.666 0.566 NA NA 0.87
我想计算每行的平均值,从第 5 列开始直到行尾,并忽略 string NA
。然后将平均值附加到每行的末尾。
输出将如下所示:
HF TLLL A T 0.999 NA 0.666 NA 0.566 NA NA 0.87 0.775
HF TLLM A T 0.500 0.500 0.666 0.566 NA NA 0.87 0.620
我一直在得到这样的总和,但不知道如何跟踪求和的整数数,以计算平均值。
awk '{x=0;for(i=5;i<=NF;i++)x=x+$i;print $0, x}'