Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在使用 R 搜索原始 twitter 片段,但不断遇到非标准字母数字字符的问题,例如以下"̆ºÌøÑ"。
"🏄"
我想[abcdefghijklmnopqrstuvwxyz0123456789]用 . 取出所有非字符gsub。
[abcdefghijklmnopqrstuvwxyz0123456789]
gsub
您可以使用gsub为那些不在的项目指定替换吗[abcdefghijklmnopqrstuvwxyz0123456789]?
你可以简单地否定你的模式[^ ...]:
[^ ...]
x <- "abcde🏄fgh" gsub("[^A-Za-z0-9]", "", x) # [1] "abcdefgh"
请注意,该类[:alnum:]匹配所有给定的特殊字符。这就是为什么gsub("[^[:alnum:]]", "", x)不起作用。
[:alnum:]
gsub("[^[:alnum:]]", "", x)