我是编程新手,我有许多 CSV 文件需要处理。每个 CSV 文件都有一个 8 行标题。在标题之后,有一行名称和数据。第二列有一堆产品名称,这是我现在主要关心的。每个产品都有一组特定的名称,我们的计算机可以识别这些名称。例如,鞋子会被识别为:shoe、sneaker、heel、loafer 等。随着时间的推移,其他名称已潜入计算机无法识别的 CSV 文件中。我想从 CSV 文件中获取这些名称并填充一个文本文件,我可以对其进行浏览、排序和添加到计算机中。CSV 底部还有额外的信息,这些信息用空行与这些信息隔开。
我知道我可能应该使用 glob 模块以及 numpy 和/或 pandas,但我只是不知道如何将我需要的所有内容合并到任何类型的工作程序中。这是我对代码的初步尝试。
import csv
import glob
import os
import numpy as np
from StringIO import StringIO
fns = glob.glob('*.csv')
for fn in fns:
data = np.genfromtxt(fns, delimiter=',')
if 'Shoe' or 'Heel' or 'Loafer' or 'sneaker':
elif 'shirt' or 'tee' or 'tank' or 'polo':
else:
如果有人有任何可以帮助的代码,那就太好了,但任何帮助都将不胜感激。谢谢你
CSV 看起来像这样
Name bunch of stuff
header stuff stuff
header stuff stuff
header stuff stuff
header stuff stuff
header stuff stuff
Count 5
NUMBER ITEM MORE PRICE1 PRICE2 ETA GOOD FAULTY OTHER
N1 Shoe stuff
N2 Heel stuff
N3 Tee I K
N4 Polo other stuff G J
N5 Sneaker other stuff H N