我不能让它工作。我想用出现和附加的空格替换 csv 文件的第一个字段中出现的所有两个字符X
,并删除空格。例如SA
并且SA
应该映射到SAX
新文件中。以下是我尝试过的sed
(通过早期问题的帮助)
system( paste("sed ","'" ,' s/^GG/GGX/g; s/^GG\\s/GGX/g; s/^GP/GPX/g;
s/^GP\\s/GPX/g; s/^FG/FGX/g; s/^FG\\s/FGX/g; s/^SA/SAX/g; s/^SA\\s/SAX/g;
s/^TP/TPX/g; s/^TP\\s/TPX/g ',"'",' ./data/concat_csv.2 >
./data/concatenated_csv.2 ',sep=''))
我尝试使用该sQuote()
功能,但这仍然没有帮助。该文件存在由 read.csv 处理的问题,因为某些字段中存在基于某些行上的分隔符过多和不足的错误。
我可以尝试分段读取和编辑文件,但我不知道如何将其作为流式处理。
我真的只想使用system()
调用编辑文件的第一个字段。该文件大约30GB。