r - 如何根据 R 数据框中特定列的条件获得逐行最大值？

Question

我试图在几列（气候缺水 - ）中通过 ROW 获得最大值，def_59_z_#具体取决于已经过去了多少时间（火灾后的时间 - YEAR.DIFF）。以下是条件：

如果 1 年过去了，请选择第一年的赤字值。( def_59_z_1)。
如果是 2 年：前 2 年的最大赤字。
如果是 3 年：前 3 年的最大赤字。
如果是 4 年：前 4 年的最大赤字。
如果 5年或以上：最多前 5 年。

但是，当我包含条件时，我无法提取逐行最大值。有几个现有的帖子解决了按行的 min 和 max（示例1和2）和 sd （示例3）——但这些不使用条件。我尝试过使用apply，但是当我涉及多个列以及条件要求时，我无法找到解决方案。

以下代码只是在新列中返回 3.5 def59_z_max15，这是数据帧中出现的最大值——除非是YEAR.DIFF1，在这种情况下def_50_z_1直接返回。但是对于所有其他条件，我想要 0.98、0.67、0.7、1.55、1.28——反映指定列的行最大值的值。链接到此处的示例数据。我怎样才能做到这一点？

我感谢任何/所有建议！

data <- data %>%
mutate(def59_z_max15 = ifelse(YEAR.DIFF == 1,
                            (def59_z_1),
                            ifelse(YEAR.DIFF == 2,
                                   max(def59_z_1, def59_z_2),
                                   ifelse(YEAR.DIFF == 3,
                                          max(def59_z_1, def59_z_2, def59_z_3),
                                          ifelse(YEAR.DIFF == 4,
                                                 max(def59_z_1, def59_z_2, def59_z_3, def59_z_4),
                                                 max(def59_z_1, def59_z_2, def59_z_3, def59_z_4, def59_z_5))))))

score 1 · Accepted Answer

将此函数放入apply族函数中

func <- function(x) {
first.val <- x[1]
if (first.val < 5) {
return(max(x[2:(first.val+)])
} else {
return(max(x[2:6]))
}
}

您所需的输出应通过以下方式获得：

apply(data, 1, function(x) func(x)) #do it by row by setting arg2 = 1

score 1 · Accepted Answer

一个选项是在循环中分别获取每组条件的pmax（按行- 矢量化）（ - 如果'YEAR.DIFF'的值为1，则仅选择'def_59_z_1'，对于2，获得'的最大值def_59_z_1' 和 'def_59_z_2', ...，对于 5，'def_59_z_1' 到 'def_59_z_5' 的最大值，这些列放在一起，并将其余部分替换为所有 'def59_z' 列中的maxmapcoalesceNApmax

library(tidyverse)
out <- map_dfc(1:5, ~
         df1 %>% 
           select(seq_len(.x) + 1) %>% 
           transmute(val = na_if((df1[["YEAR.DIFF"]] == .x)*
               pmax(!!! rlang::syms(names(.))), 0))) %>%  
  transmute(def59_z_max15 = coalesce(!!! rlang::syms(names(.)))) %>%
  bind_cols(df1, .)%>%
  mutate(def59_z_max15 = case_when(is.na(def59_z_max15) ~ 
         pmax(!!! rlang::syms(names(.)[2:6])), TRUE ~ def59_z_max15))
head(out, 10)
#   YEAR.DIFF def59_z_1 def59_z_2 def59_z_3 def59_z_4 def59_z_5 def59_z_max15
#1          5      0.25     -2.11      0.98     -0.07      0.31          0.98
#2          9      0.67      0.65     -0.27      0.52      0.26          0.67
#3         10      0.56      0.33      0.03      0.70     -0.09          0.70
#4          2     -0.34      1.55     -1.11     -0.40      0.94          1.55
#5          4      0.98      0.71      0.41      1.28     -0.14          1.28
#6          3      0.71     -0.17      1.70     -0.57      0.43          1.70
#7          4     -1.39     -1.71     -0.89      0.78      1.22          0.78
#8          4     -1.14     -1.46     -0.72      0.74      1.32          0.74
#9          2      0.71      1.39      1.07      0.65      0.29          1.39
#10         1      0.28      0.82     -0.64      0.45      0.64          0.28

数据

df1 <- read.csv("https://raw.githubusercontent.com/CaitLittlef/random/master/data.csv")

r - 如何根据 R 数据框中特定列的条件获得逐行最大值？

2 回答 2

数据

Related

Reference