python - CSV 文件 - 合并，如果列具有相同的值：

Question

我正在整合 2 个 CSV 文件。

文件由以下列组成：

第一个.csv：

SKU | Name | Quantity | Active
121 | Jablko | 23 | 1

另一个 .csv 包含以下内容：

SKU | Quantity
232 | 4
121 | 2

我想在 Linux 中用来自 2.csv 的数据更新 1.csv，知道如何以最好的方式做到这一点吗？Python？

score 3 · Accepted Answer

awk 解决方案：

awk -F ' \\| ' -v OFS=' | ' '
    NR == FNR {val[$1] = $2; next}
    $1 in val {$3 = val[$1]} 
    {print}
' 2.csv 1.csv

输入FS字段分隔符变量被视为正则表达式，而输出字段分隔符被视为纯字符串，因此管道字符的处理方式不同。

score 2 · Accepted Answer

这是使用 gnu awk ( awk -f script.awk file2.csv file1.csv) 的解决方案：

BEGIN {FS=OFS="|"}
FNR == NR {
     upd[$1] = $2
     next
}

{$3 = upd[$1]; print}

score 1 · Accepted Answer

未经测试，但大致如下：

import csv
from itertools import islice

with open('first.csv') as f1, open('second.csv') as f2, open('new', 'wb') as fout:
    sku_to_qty = dict(islice(csv.reader(f2, delimiter='|'), 1, None)) # create lookup table
    csvin = csv.reader(f1, delimiter='|') # input
    csvout = csv.writer(fout, delimiter='|') # output
    csvout.writerow(next(csvin)) # write header
    for row in csvin:
        row[2] = sku_to_qty.get(row[0], row[2]) # update or presume the same
        csvout.writerow(row)

score 1 · Accepted Answer

1

awk 'BEGIN{FS=OFS="|"}NR==FNR{a[$1]=$2;next}{$3=a[$1]" "}1' second.csv first.csv

于 2013-06-17T18:08:56.090 回答

python - CSV 文件 - 合并，如果列具有相同的值：

4 回答 4

Related

Reference