我有以下格式的数据,称为 DF(这只是一个简化的示例):
eval.num, eval.count, fitness, fitness.mean, green.h.0, green.v.0, offset.0 random
1 1 1500 1500 100 120 40 232342
2 2 1000 1250 100 120 40 11843
3 3 1250 1250 100 120 40 981340234
4 4 1000 1187.5 100 120 40 4363453
5 1 2000 2000 200 100 40 345902
6 1 3000 3000 150 90 10 943
7 1 2000 2000 90 90 100 9304358
8 2 1800 1900 90 90 100 284333
但是,eval.count 列不正确,我需要修复它。它应该仅通过查看前面的行来报告(green.h.0、green.v.0 和 offset.0)具有相同值的行数。
上面的示例使用了预期值,但假设它们不正确。
如何添加一个新列(比如“计数”),它将计算所有先前具有相同指定变量值的行?
我在一个类似的问题上得到了帮助,即只为指定列选择具有相同值的所有行,所以我想我可以围绕它编写一个循环,但这对我来说似乎效率低下。