r - 创建一个 ID（行号）列

Question

我需要创建一个具有唯一 ID 的列，基本上将行号添加为自己的列。我当前的数据框如下所示：

如何使它看起来像这样：

?

非常感谢

score 46 · Accepted Answer

两个tidyverse替代方案（使用 sgibb 的示例数据）：

tibble::rowid_to_column(d, "ID")

这使：

或者：

dplyr::mutate(d, ID = row_number())

这使：

如您所见， -function 在其他列之前添加新列rowid_to_column，而mutate& row_number()-combo 在其他列之后添加新列。

还有另一个基础 R 替代方案：

d$ID <- seq_along(d[,1])

score 29 · Accepted Answer

你可以使用cbind：

d <- data.frame(V1=c(23, 45, 56), V2=c(45, 45, 67))

## enter id here, you could also use 1:nrow(d) instead of rownames
id <- rownames(d)
d <- cbind(id=id, d)

## set colnames to OP's wishes
colnames(d) <- paste0("V", 1:ncol(d))

编辑：这里是@dacko 建议的比较。d$id <- seq_len(nrow(d)稍微快一点，但列的顺序不同（id是最后一列；重新排序似乎比使用慢cbind）：

library("microbenchmark")

set.seed(1)
d <- data.frame(V1=rnorm(1e6), V2=rnorm(1e6))

cbindSeqLen <- function(x) {
  return(cbind(id=seq_len(nrow(x)), x))
}

dickoa <- function(x) {
  x$id <- seq_len(nrow(x))
  return(x)
}

dickoaReorder <- function(x) {
  x$id <- seq_len(nrow(x))
  nc <- ncol(x)
  x <- x[, c(nc, 1:(nc-1))]
  return(x)
}

microbenchmark(cbindSeqLen(d), dickoa(d), dickoaReorder(d), times=100)

# Unit: milliseconds
#             expr      min       lq   median       uq      max neval
#   cbindSeqLen(d) 23.00683 38.54196 40.24093 42.60020 47.73816   100
#        dickoa(d) 10.70718 36.12495 37.58526 40.22163 72.92796   100
# dickoaReorder(d) 19.25399 68.46162 72.45006 76.51468 88.99620   100

score 24 · Accepted Answer

24

您也可以使用以下方法执行此操作dplyr：

DF <- mutate(DF, id = rownames(DF))

于 2014-10-23T20:45:57.233 回答

score 21 · Accepted Answer

许多人提出了他们的想法，但我认为这是完成这项任务的最排序和最简单的代码：

data$ID <- 1:nrow(data)

一条线。唯一的。

score 9 · Accepted Answer

data.table 解决方案

语法更简单，速度更快

library(data.table)

dt <- data.table(V1=c(23, 45, 56), V2=c(45, 45, 67))

setnames(dt, c("V2", "V3")) # changing column names
dt[, V1 := .I] # Adding ID column

score 5 · Accepted Answer

希望这会有所帮助。创建 ID 列的最短和最佳方法是：

dataframe$ID <- seq.int(nrow(dataframe))

score 4 · Accepted Answer

这是一个保留 dplyr 管道格式并将 id 放在第一列的解决方案，这可能是首选。

d %>% 
  mutate(id = rownames(.)) %>% 
  select(id, everything())

score 3 · Accepted Answer

如果您从 df 中没有命名行开始，那么整洁的方法是：

df %>% 
  mutate(id = row_number()) %>% 
  select(id, everything())

score 0 · Accepted Answer

该函数rownames_to_column()将行名移动到列中；在tidyverse包 ( docs ) 中找到。

rownames_to_column(DF, "my_column_name")

用于column_to_rownames()反向操作。

r - 创建一个 ID（行号）列

9 回答 9

data.table 解决方案

Related

Reference