我有以下几行(实际上有大约 1M 这些行):
foo|||bar
qux||boo|fzx
请注意,每行正好包含 4 个字段,但字符数可以超过 3 个。
我想要做的是||
用|nil|
结果替换每个:
foo|nil|nil|bar
qux|nil|boo|fzx
用 sed 的方法是什么?
我试过这个但失败了:
sed 's/||/|nil/g'
您需要重复替换,直到它不改变:
sed ':a; s/||/|nil|/g; ta'
但是,这不会处理开头或结尾的空字段,因为您需要另外两种模式:
sed 's/^|/nil|/; s/|$/|nil/; :a; s/||/|nil|/g; ta'
测试
输入:
cat << EOF > infile
foo|||bar
qux||boo|fzx
|||
EOF
运行:
<infile sed 's/^|/nil|/; s/|$/|nil/; :a; s/||/|nil|/g; ta'
输出:
foo|nil|nil|bar
qux|nil|boo|fzx
nil|nil|nil|nil
awk '{ for(i=1;i<=NF;i++) if(length($i)==0) $i="nil" } 1' FS='|' OFS='|'