1

我有以下数据框,它是read_excelexcel 中缺少列名的输出:

t <- tibble(A=rnorm(3), B=rnorm(3), "x"=rnorm(3), "y"=rnorm(3), Z=rnorm(3))
colnames(t)[3:4] <-  c("..3", "..4")

如何以灵活的动态方式选择列..3Z不取决于数字或表格宽度)。我正在考虑类似的方向:

t %>% select(-starts_with(".."):-last_col())

但这会发出警告,因为starts_with返回两个值。

4

2 回答 2

1

我们可以强制选择第一个:

t %>% select(-c(starts_with("..")[ 1 ]:last_col()))
# # A tibble: 3 x 2
#       A      B
#   <dbl>  <dbl>
# 1 0.889  0.505
# 2 0.655 -2.15 
# 3 1.34  -0.290

或“更整洁”的方式首先使用:

select(-first(starts_with("..")):-last_col())
于 2021-01-11T10:47:58.017 回答
0

您可以使用基本 R 来做到这一点:

t[cumsum(startsWith(names(t), "..")) == 0]

# # A tibble: 3 x 2
#       A       B
#   <dbl>   <dbl>
# 1 -1.56 -0.0747
# 2 -1.68 -0.847 
# 3 -1.23 -1.20

您也可以使用select()

t %>% 
  select(which(cumsum(startsWith(names(t), "..")) == 0))

PS。不要t在 R 中用作变量名,因为它是函数名。

于 2021-01-11T10:43:53.197 回答