4

我正在使用 R 搜索原始 twitter 片段,但不断遇到非标准字母数字字符的问题,例如以下"̆ºÌøÑ"

我想[abcdefghijklmnopqrstuvwxyz0123456789]用 . 取出所有非字符gsub

您可以使用gsub为那些不在的项目指定替换[abcdefghijklmnopqrstuvwxyz0123456789]

4

1 回答 1

9

你可以简单地否定你的模式[^ ...]

x <- "abcde🏄fgh"
gsub("[^A-Za-z0-9]", "", x)
# [1] "abcdefgh"

请注意,该类[:alnum:]匹配所有给定的特殊字符。这就是为什么gsub("[^[:alnum:]]", "", x)不起作用。

于 2013-07-26T10:43:04.820 回答