我必须用 R 读取一个文件,其中可变数量的列由|
字符分隔。但是,如果它前面有 a \
,则不应将其视为分隔符。
我首先认为类似的东西strsplit(x, "[^\\][|]")
会起作用,但这里的问题是每个管道之前的字符都被“消耗”了:
> strsplit("word1|word2|word3\\|aha!|word4", "[^\\][|]")
[[1]]
[1] "word" "word" "word3\\|aha" "word4"
谁能建议一种方法来做到这一点?理想情况下,它应该被矢量化,因为有问题的文件非常大。