如何从 R 中的字符串中删除所有特殊字符并用空格替换它们?
要删除的一些特殊字符是:~!@#$%^&*(){}_+:"<>?,./;'[]-=
我尝试过regex
使用[:punct:]
模式,但它只删除标点符号。
问题2:以及如何从外语中删除字符,例如:â í ü Â á ą ę ś ć
?
回答: 使用[^[:alnum:]]
删除~!@#$%^&*(){}_+:"<>?,./;'[]-=
和使用[^a-zA-Z0-9]
删除也在â í ü Â á ą ę ś ć
或regex
功能regexpr
。
基础 R 中的解决方案:
x <- "a1~!@#$%^&*(){}_+:\"<>?,./;'[]-="
gsub("[[:punct:]]", "", x) # no libraries needed