我已经编辑了以下脚本片段来完成我的数据集的排名函数。现在,当我让它作为循环脚本的一部分运行时,它会一遍又一遍地将数据附加到 csv 的末尾列。换句话说,csv 只是累积列。
我不确定如何执行此操作,但我需要代码始终将数据输入到第 17 列。目前在脚本的第一次运行时,csv 包含 16 列,但是在第二次运行时,csv 包含 25 列,并且需要在第二次运行时覆盖第 17 列,而不仅仅是将结果附加到第 26 行。
import csv
from itertools import count
from collections import defaultdict
from functools import partial
counts = defaultdict(partial(count, 1)) # create a new count starting at 1
# Read in the data
with open('../MODIFIED.csv', 'rb') as f:
# if you have a header on the file
# header = f.readline().strip().split(',')
data = [line.strip().split(',') for line in f]
with open("../MODIFIED.csv", 'wb') as outfile:
writer = csv.writer(outfile)
for counter, row in enumerate(data):
counter += 1
if counter >=2:
row[9] = next(counts[row[2]]) # get the next count value