1

所以我正在尝试清理 R 中的字符串,并且我希望能够清理所有非字母元素的每个字符串。我知道我可以只使用 gsub 单独执行它们,但我希望能够取出所有这些(不包括空格),或者如果我将其归结为删除空格的单个字符串,也可以剥离它们。

例如,如果我有一个电子邮件地址作为字符串向量,“abc123@gmail.com”,或形式为(“abc”,“123”,“abc123”)的字符串向量,剥离它们应该产生“abcgmailcom”和 ("abc", "", "abc") 分别。我只会使用多个字符串的向量。

4

1 回答 1

3

像这样?

char <- c("dc2 54üx*","%67{~\\hjkh")
#[1] "dc2 54üx*"   "%67{~\\hjkh"
gsub("[^[:alpha:] ]","",char)
#[1] "dc üx" "hjkh"
于 2013-06-17T09:40:16.643 回答