我正在使用字典对 CSV 文件中的数据进行分组,因此例如第一列和第二列是 dict 键,值将是第 3,4 列的元组列表。
我的代码片段是:
import csv
import collections
csvDicData_ = dict()
fh = open('myfile.csv', 'rt')
reader = csv.reader(fh, delimiter=';', skipinitialspace=True)
for indx, row in enumerate(reader):
if row:
#-- put in a dictionary form: #csvDicData_[(row[0],row[1])] = (row[2],row[3])
key = (row[0],row[1])
value = (row[2],row[3])
#-- I'd like to use the row below (commented) insted of the next two, I expect the same result...
#csvDicData_.setdefault(key,[value]).append(value)
if (not key in csvDicData_): csvDicData_[key] = [value]
else: csvDicData_[key].append(value)
上面的代码产生了正确的结果,尽管我尝试使用csvDicData_.setdefault(key,[value]).append(value)
并且由于某种我不明白的原因,len(csvDicData_[('field1x','field2x')] ))
总是有一个预期的项目(值(0,0)。
为什么会出现这种行为(就像 CSV 文件中每个键的第一行自动将元组 (0,0) 添加到字典/键中一样)。