1

我正在整合 2 个 CSV 文件。

文件由以下列组成:

第一个.csv:

SKU | Name | Quantity | Active
121 | Jablko | 23 | 1

另一个 .csv 包含以下内容:

SKU | Quantity
232 | 4
121 | 2

我想在 Linux 中用来自 2.csv 的数据更新 1.csv,知道如何以最好的方式做到这一点吗?Python?

4

4 回答 4

3

awk 解决方案:

awk -F ' \\| ' -v OFS=' | ' '
    NR == FNR {val[$1] = $2; next}
    $1 in val {$3 = val[$1]} 
    {print}
' 2.csv 1.csv

输入FS字段分隔符变量被视为正则表达式,而输出字段分隔符被视为纯字符串,因此管道字符的处理方式不同。

于 2013-06-17T17:59:46.160 回答
2

这是使用 gnu awk ( awk -f script.awk file2.csv file1.csv) 的解决方案:

BEGIN {FS=OFS="|"}
FNR == NR {
     upd[$1] = $2
     next
}

{$3 = upd[$1]; print}
于 2013-06-17T18:06:42.393 回答
1

未经测试,但大致如下:

import csv
from itertools import islice

with open('first.csv') as f1, open('second.csv') as f2, open('new', 'wb') as fout:
    sku_to_qty = dict(islice(csv.reader(f2, delimiter='|'), 1, None)) # create lookup table
    csvin = csv.reader(f1, delimiter='|') # input
    csvout = csv.writer(fout, delimiter='|') # output
    csvout.writerow(next(csvin)) # write header
    for row in csvin:
        row[2] = sku_to_qty.get(row[0], row[2]) # update or presume the same
        csvout.writerow(row)
于 2013-06-17T18:02:43.363 回答
1
awk 'BEGIN{FS=OFS="|"}NR==FNR{a[$1]=$2;next}{$3=a[$1]" "}1' second.csv first.csv
于 2013-06-17T18:08:56.090 回答