我有一个看起来像这样的数据框:
d <- data.frame(Vessel = c("Hondo", "Whamo", "Hondo", "Delta", "Whamo", "Hondo"),
PAX = c(250, 252, 249, 353, 252, 250),
crew = c(35, 63, 36, NA, NA, NA))
我想使用条件自连接之类的东西来估算 NA,如果框架中有另一行具有相同的 Vessel,它会根据相应的行更新船员值(如果有多个相应的行,它可以对船员值,选择最大/最小……这无关紧要,因为船员值不会发生巨大变化……如果没有相应的记录,它会按轮次(0.25 * PAX)更新船员。我有一种感觉ddply将是去这里的方式,我很抱歉无法自己解决这个问题......我无法解决这个问题。我希望最终的 data.frame 看起来像这样:
VESSEL PAX crew
Hondo 250 35
Whamo 252 63
Hondo 249 36
Delta 353 88
Whamo 254 63
Hondo 250 35
注意:PAX 和 CREW 值可能会有所不同(CREW 变化很小),因此最后一个“Hondo”CREW 值可能是 35、36 或接近的值(但它应该基于查找而不是计算)。
提前致谢,--JT