2

目标是转换数据框的列。这是示例:

  df <- data.frame( fact=c("dog",2,"NA",0,"cat",1,"Cat"),
              value=c(4,2,6,0,9,1,3) ); df$fact <- as.factor(df$fac)

  func <- function(data,fac,val){
          data <- data %>%  
          mutate_(fac= interp(~tolower(fac), fac=as.name(fac)) ) %>%
          mutate_(val= interp(~ifelse(fac=='cat',1*val,
                       ifelse(fac=='dog',2*val,0)), fac=as.name(fac), val=as.name(val)))
  return(data) } 

来电:

new.df <- func(df,"fact","value")

     fact value  fac val
   1  dog     4  dog  8
   2    2     2   2   0
   3   NA     6  na   0
   4    0     0   0   0
   5  cat     9 cat   9
   6    1     1   1   0
   7  Cat     3 cat   0

提出 2 个问题:(1)- 与“Cat”关联的值为 false;应该是 3*1=3 (2) - 理想情况下,调用会返回原始 data.framedf以及转换后的变量factvalue变量。

有什么想法吗?感谢你们。

编辑:请注意,df还有另一列third应该不受对factand所做的操作的影响value

4

2 回答 2

4

在 OP 的代码中,“val”是基于未修改的“fact”列创建的。如果我们从一开始就使用修改后的 'fac',mutate_则不需要as.name(fac).

library(lazyeval)
library(dplyr)
func <- function(data,fac,val){
      data <- data %>%  
               mutate_(fac= interp(~tolower(fac), fac=as.name(fac))) %>%
               mutate_(val= interp(~ifelse(fac=='cat',1*val,
                   ifelse(fac=='dog',2*val,0)), val=as.name(val)))
  return(data) } 

func(df, 'fact', 'value')
#  fact value fac val
#1  dog     4 dog   8
#2    2     2   2   0
#3   NA     6  na   0
#4    0     0   0   0
#5  cat     9 cat   9
#6    1     1   1   0
#7  Cat     3 cat   3

如果我们只需要返回修改后的列,请使用transmute_

func1 <- function(data,fac,val){
      data <- data %>%  
               transmute_(fac= interp(~tolower(fac), fac=as.name(fac)), 
                      val= interp(~ifelse(fac=='cat',1*val,
                         ifelse(fac=='dog',2*val,0)), val=as.name(val)))
     return(data) } 

func1(df, 'fact', 'value')
#  fac val
#1 dog   8
#2   2   0
#3  na   0
#4   0   0
#5 cat   9
#6   1   0
#7 cat   3
于 2015-09-24T13:48:41.127 回答
2

如果您想使用原始名称返回原始列(可能包括 data.frame 中的其他列),您可以使用稍微不同的 dplyr-approachmutate_each代替mutate

library(lazyeval)
library(dplyr)

func <- function(data,fac,val) {
  data %>%  
    mutate_each_(interp(~tolower(var), var = as.name(fac)), fac) %>% 
    mutate_each_(interp(~ifelse(col =='cat', var, ifelse(col == 'dog',2*var, 0)), 
             var=as.name(val), col = as.name(fac)), val)
}

使用功能:

func(df, "fact", "value")
#  fact value
#1  dog     8
#2    2     0
#3   na     0
#4    0     0
#5  cat     9
#6    1     0
#7  cat     3

如果您希望保留数据中的其他列(而由于 akrun 的方法将删除它们),则可以证明与 akruns 答案的区别transmute

df$some_column <- letters[1:7]  # add a new column

使用该函数后,其他列现在仍保留在您的数据中,并且修改后的列保留其原始名称:

func(df, "fact", "value")
#  fact value some_column
#1  dog     8           a
#2    2     0           b
#3   na     0           c
#4    0     0           d
#5  cat     9           e
#6    1     0           f
#7  cat     3           g
于 2015-09-24T14:28:58.130 回答