这是我的数据:
x <- 'aaaaa,"bbb",ccccc,"dddd",abcd"dddd"'
如何删除"bbb":"dddd"和"dddd"
所以我可以得到:
"aaaaa","ccccc","abcd"
谢谢!
我们可以使用gsub匹配双引号 ( ") 后跟一个或多个不是双引号 ( [^"]+) 的字符后跟双引号 ( ") 和,如果存在并替换为空白 ( "")的模式
gsub('"[^"]+",?', "", txt)
[1] "aaaaa,ccccc,abcd"
如果我们需要保持,中间
gsub('"[^"]+"', "", txt)
[1] "aaaaa,,ccccc,,abcd"
txt <- 'aaaaa,"bbb",ccccc,"dddd",abcd"dddd"'
您可以删除带有双引号的单词。
gsub('"\\w+",?', '', x)
#[1] "aaaaa,ccccc,abcd"
如果您希望它们作为单词的向量-
strsplit(gsub('"\\w+",?', '', x), ',')[[1]]
#[1] "aaaaa" "ccccc" "abcd"