我已经能够从GAWK 的 GNU 页面了解它可以使用FPAT
变量处理数据中的分隔符,但我无法弄清楚它是如何工作的。对于 CSV 文件,FPAT 值为:
FPAT = "([^,]+)|(\"[^\"]+\")"
使用数据:
abc,"pqr,mno"
第一个分组表达式计算所有内容,即不是逗号,这应该"abc"
作为数据,然后在第一次出现逗号时失败。现在我的问题是接下来会发生什么?由于第一个分组表达式失败,正则表达式是否会使用 or 条件从逗号后的字符继续?但是第一个分组表达式对逗号后的所有数据仍然有效,因此它可能会"pqr
作为下一个数据?