我正在整合 2 个 CSV 文件。
文件由以下列组成:
第一个.csv:
SKU | Name | Quantity | Active
121 | Jablko | 23 | 1
另一个 .csv 包含以下内容:
SKU | Quantity
232 | 4
121 | 2
我想在 Linux 中用来自 2.csv 的数据更新 1.csv,知道如何以最好的方式做到这一点吗?Python?
awk 解决方案:
awk -F ' \\| ' -v OFS=' | ' '
NR == FNR {val[$1] = $2; next}
$1 in val {$3 = val[$1]}
{print}
' 2.csv 1.csv
输入FS
字段分隔符变量被视为正则表达式,而输出字段分隔符被视为纯字符串,因此管道字符的处理方式不同。
这是使用 gnu awk ( awk -f script.awk file2.csv file1.csv
) 的解决方案:
BEGIN {FS=OFS="|"}
FNR == NR {
upd[$1] = $2
next
}
{$3 = upd[$1]; print}
未经测试,但大致如下:
import csv
from itertools import islice
with open('first.csv') as f1, open('second.csv') as f2, open('new', 'wb') as fout:
sku_to_qty = dict(islice(csv.reader(f2, delimiter='|'), 1, None)) # create lookup table
csvin = csv.reader(f1, delimiter='|') # input
csvout = csv.writer(fout, delimiter='|') # output
csvout.writerow(next(csvin)) # write header
for row in csvin:
row[2] = sku_to_qty.get(row[0], row[2]) # update or presume the same
csvout.writerow(row)
awk 'BEGIN{FS=OFS="|"}NR==FNR{a[$1]=$2;next}{$3=a[$1]" "}1' second.csv first.csv