2

我正在重命名数据框中的大多数变量,但我的方法并没有给我留下深刻的印象。

因此,SO 上的任何人是否有比下面介绍的仅使用基础的更智能或更快的方法?

    data(mtcars)
  # head(mtcars)


  temp.mtcars <- mtcars
  names(temp.mtcars) <- c((x <- c("mpg", "cyl", "disp")), 
                           gsub('^', "baR.", setdiff(names (mtcars),x)))
  str(temp.mtcars)
  'data.frame': 32 obs. of  11 variables:
   $ mpg     : num  21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
   $ cyl     : num  6 6 4 6 8 6 8 4 4 6 ...
   $ disp    : num  160 160 108 258 360 ...
   $ baR.hp  : num  110 110 93 110 175 105 245 62 95 123 ...
   $ baR.drat: num  3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
   $ baR.wt  : num  2.62 2.88 2.32 3.21 3.44 ...
   $ baR.qsec: num  16.5 17 18.6 19.4 17 ...
   $ baR.vs  : num  0 0 1 1 0 1 0 1 1 1 ...
   $ baR.am  : num  1 1 1 0 0 0 0 0 0 0 ...
   $ baR.gear: num  4 4 4 3 3 3 3 4 4 4 ...
   $ baR.carb: num  4 4 1 1 2 1 4 2 2 4 ...
4

5 回答 5

7

仅使用基本 R 编辑答案

该软件包plyr有一个方便的功能rename(),可以满足您的要求。您修改后的问题指定仅使用基础 R。一种简单的方法是简单地复制代码plyr::rename并创建自己的函数。

rename <- function (x, replace) {
  old_names <- names(x)
  new_names <- unname(replace)[match(old_names, names(replace))]
  setNames(x, ifelse(is.na(new_names), old_names, new_names))
}

该函数rename接受一个命名向量的参数,其中向量的元素是新名称,向量的名称是现有名称。有很多方法可以构建这样一个命名向量。在下面的示例中,我只是使用structure.

x <- c("mpg", "disp", "wt")
some.names <- structure(paste0("baR.", x), names=x)
some.names
       mpg       disp         wt 
 "baR.mpg" "baR.disp"   "baR.wt" 

现在您已准备好重命名:

mtcars  <- rename(mtcars, replace=some.names)

结果:

'data.frame':   32 obs. of  11 variables:
 $ baR.mpg : num  21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
 $ cyl     : num  6 6 4 6 8 6 8 4 4 6 ...
 $ baR.disp: num  160 160 108 258 360 ...
 $ hp      : num  110 110 93 110 175 105 245 62 95 123 ...
 $ drat    : num  3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
 $ baR.wt  : num  2.62 2.88 2.32 3.21 3.44 ...
 $ qsec    : num  16.5 17 18.6 19.4 17 ...
 $ vs      : num  0 0 1 1 0 1 0 1 1 1 ...
 $ am      : num  1 1 1 0 0 0 0 0 0 0 ...
 $ gear    : num  4 4 4 3 3 3 3 4 4 4 ...
 $ carb    : num  4 4 1 1 2 1 4 2 2 4 ...
于 2012-05-19T06:39:48.783 回答
3

我会使用ifelse

names(temp.mtcars) <- ifelse(names(mtcars) %in% c("mpg", "cyl", "disp"),
                             names(mtcars),
                             paste("bar", names(mtcars), sep = "."))
于 2012-05-19T23:57:46.470 回答
2

几乎相同但没有plyr

data(mtcars)

temp.mtcars <- mtcars

carNames <- names(temp.mtcars)
modifyNames <- !(carNames %in% c("mpg", "cyl", "disp"))

names(temp.mtcars)[modifyNames] <- paste("baR.", carNames[modifyNames], sep="")

输出:

str(temp.mtcars)
'data.frame':   32 obs. of  11 variables:
$ mpg     : num  21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
$ cyl     : num  6 6 4 6 8 6 8 4 4 6 ...
$ disp    : num  160 160 108 258 360 ...
$ baR.hp  : num  110 110 93 110 175 105 245 62 95 123 ...
$ baR.drat: num  3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
$ baR.wt  : num  2.62 2.88 2.32 3.21 3.44 ...
$ baR.qsec: num  16.5 17 18.6 19.4 17 ...
$ baR.vs  : num  0 0 1 1 0 1 0 1 1 1 ...
$ baR.am  : num  1 1 1 0 0 0 0 0 0 0 ...
$ baR.gear: num  4 4 4 3 3 3 3 4 4 4 ...
$ baR.carb: num  4 4 1 1 2 1 4 2 2 4 ...
于 2012-05-19T10:25:47.983 回答
1

您可以使用包rename.vars中的功能gdata。当您只想替换变量名称的子集并且名称向量的顺序与 data.frame 中名称的顺序不同时,它很有效。

改编自帮助文件:

library(gdata)
data <- data.frame(x=1:10,y=1:10,z=1:10)
names(data)
data <- rename.vars(data, from=c("z","y"), to=c("Z","Y"))
names(data)

转换 data.frame 名称:

[1] "x" "y" "z"

[1] "x" "Y" "Z"

即,请注意这如何处理子集以及名称字符串与 data.frame 中名称的顺序不同的事实。

于 2015-03-05T04:34:02.627 回答
0
names(df)[match(
                c('old_var1','old_var2'),
                names(df)
               )]=c('new_var1', 'new_var2')
于 2015-12-11T02:29:07.833 回答