csv - 更改文件中的分隔符

Question

下面我有他们应该做的文件，再往下是我到目前为止所做的。我认为在我的代码中是问题的根源：分隔符，但我不能让它变得更好。

我的源文件带有;分隔符，我的数据库文件带有分隔,符；此外，字符串在“”之间：

类别文件应该是这样的：

"1","1","testcategory","testdescription"

制造商文件，如下所示：

"24","ASUS",NULL,NULL,NULL
"23","ASROCK",NULL,NULL,NULL
"22","ARNOVA",NULL,NULL,NULL

我此刻所拥有的：

- category file:
1;2;Alarmen en beveiligingen;
2;2;Apparatuur en toebehoren;
3;2;AUDIO;

- manufacturers file:
315;XTREAMER;NULL;NULL;NULL
316;XTREMEMAC;NULL;NULL;NULL
317;Y-CAM;NULL;NULL;NULL
318;ZALMAN;NULL;NULL;NULL

我尝试了一下使用sed；首先，在类别文件上：

cut -d ";" -f1 /home/arno/pixtmp/pixtmp.csv |sort | uniq >        /home/arno/pixtmp/categories_description-in.csv
sed 's/^/;2;/g' /home/arno/pixtmp/categories_description-in.csv > /home/arno/pixtmp/categories_description-in.tmp
sed -e "s/$/;/" /home/arno/pixtmp/categories_description-in.tmp > /home/arno/pixtmp/categories_description-in.tmp2
awk 'BEGIN{n=1}{printf("%s%s\n",n++,$0)}' /home/arno/pixtmp/categories_description-in.tmp2 > /home/arno/pixtmp/categories_description$

然后在制造商文件上：

cut -d ";" -f5 /home/arno/pixtmp/pixtmp.csv |sort | uniq > /home/arno/pixtmp/manufacturers-in
sed 's/^/;/g' /home/arno/pixtmp/manufacturers-in > /home/arno/pixtmp/manufacturers-tmp
sed -e "s/$/;NULL;NULL;NULL/" /home/arno/pixtmp/manufacturers-tmp > /home/arno/pixtmp/manufacturers-tmp2
awk 'BEGIN{n=1}{printf("%s%s\n",n++,$0)}' /home/arno/pixtmp/manufacturers-tmp2 > /home/arno/pixtmp/manufacturers.ok

score 2 · Accepted Answer

您试图通过使用 cut、sed 和 AWK 来解决问题。AWK 本身就足以解决您的问题。

我编写了一个可以处理您的两个示例的 AWK 程序。如果 NULL 不是特殊情况，并且制造商的文件是不同的格式，您将需要制作两个 AWK 程序，但我认为应该清楚如何去做。

我们在这里所做的只是告诉 AWK “字段分隔符”是分号。然后 AWK 将输入行拆分为我们的字段。我们遍历字段，边走边打印。

#!/usr/bin/awk -f

BEGIN {
    FS = ";"

    DQUOTE = "\""
}

function add_quotes(s) {
    if (s == "NULL")
        return s
    else
        return DQUOTE s DQUOTE
}

NF > 0 {
    # if input ended with a semicolon, last field will be empty
    if ($NF == "")
        NF -= 1  # subtract one from NF to forget the last field

    if (NF > 0)
    {
        for (i = 1; i <= NF - 1; ++i)
            printf("%s,", add_quotes($i))
        printf("%s\n", add_quotes($i))
    }
}

csv - 更改文件中的分隔符

1 回答 1

Related

Reference