我的数据集包含product
类型和purchase
数量列。我希望能够从每行的实际数量中减去purchase
每种类型的平均数量。product
purchase
我有一个大致像这样的数据集
library(dplyr)
set.seed(42)
product <- paste("prod - " , sample(c("A", "B", "C", "D"), size = 15,
replace = TRUE))
purch <- sample(5:10, size = 15, replace = TRUE)
fake_data <- tibble(product, purch)
我可以使用 split-apply-combine 方法来做到这一点,如下所示:
data_s <- split(fake_data, fake_data$product) #split
data_a <- lapply(data_s, function(m) cbind(m, m$purch - mean(m$purch))) #apply
data_c <- bind_rows(data_a) #combine
这可行,但它发生在使用%>%
and的长而组织良好的链的中间dplyr
。有没有办法做到这一点dplyr
,这样我就可以在不破坏链条的情况下得到我需要的东西?
谢谢你。