51

我有一个字母数字字符列表,如下所示:

x <-c('ACO2', 'BCKDHB456', 'CD444')

我想要以下输出:

x <-c('ACO', 'BCKDHB', 'CD')

有什么建议么?

# dput(tmp2)

structure(c(432L, 326L, 217L, 371L, 179L, 182L, 188L, 268L, 255L,..., 
), class = "factor")
4

4 回答 4

99

您可以gsub为此使用:

gsub('[[:digit:]]+', '', x)

或者

gsub('[0-9]+', '', x)
# [1] "ACO"    "BCKDHB" "CD" 
于 2012-11-27T17:56:23.270 回答
13

如果您的目标只是删除数字,则该removeNumbers()函数会从文本中删除数字。使用它可以降低出错的风险。

library(tm)

x <-c('ACO2', 'BCKDHB456', 'CD444') 

x <- removeNumbers(x)

x

[1] "ACO"    "BCKDHB" "CD"    
于 2017-05-31T19:09:11.177 回答
11

使用字符串

大多数 stringr 函数处理正则表达式

str_replace_all会做你需要的

str_replace_all(c('ACO2', 'BCKDHB456', 'CD444'), "[:digit:]", "")
于 2020-02-05T15:14:47.300 回答
6

使用stringi的解决方案:

# your data
x <-c('ACO2', 'BCKDHB456', 'CD444')

# extract capital letters
x <- stri_extract_all_regex(x, "[A-Z]+")

# unlist, so that you have a vector
x <- unlist(x)

一行解决方案:

R中的在线截图

于 2016-10-07T09:27:29.250 回答