我原来的观察是这样的:
名称分析物 弹簧 0.1 冬天 0.4
为了计算 p 值,我做了自举模拟:
名称分析物 弹簧 0.001 冬天 0 弹簧 0 冬天 0.2 弹簧 0.03 冬天 0 弹簧 0.01 冬天 0.02 弹簧 0.1 冬天 0.5 弹簧 0 冬天 0.04 弹簧 0.2 冬天 0 弹簧 0 冬天 0.06 弹簧 0 冬天 0 ......
现在我想计算经验 p 值:在原始数据中,冬季分析物 = 0.4 - 如果在自举数据中,冬季分析物 >=0.4(例如 1 次)并且已完成自举(例如 100 次),那么经验 p 值对于冬季分析物计算:
1/100 = 0.01
(数据与原始数据相同或更高的次数除以观察总数)对于弹簧分析物,p 值为:
2/100 = 0.02
我想用 awk 计算这些 p 值。我对春天的解决方案是:
awk -v VAR="spring" '($1==VAR && $2>=0.1) {n++} END {print VAR,"p-value=",n/100}'
spring p-value= 0.02 我需要的帮助是将原始文件(名称为 spring 和 Winter 及其分析物、观察结果和观察次数)传递到 awk 并分配它们。