代码(在下面重现)读入一个文件,做一些事情,并将原始文件的一个子集输出到一个新文件中。如何稍微调整一下,而是将初始文件中的所有内容输出到输出文件,但添加一个“标志”列,其值为“1”,其中该行是当前输出的行(我们最感兴趣的行的子集)?其他行(当前仅在输入文件中的行)在新的“标志”列中将有一个空白或“0”。
这个问题对我来说经常发生,只要有一个通用的方法就可以节省我很多时间。
非常感谢任何帮助!
import csv
inname = "aliases.csv"
outname = "output.csv"
def first_word(value):
return value.split(" ", 1)[0]
with open(inname, "r", encoding = "utf-8") as infile:
with open(outname, "w", encoding = "utf-8") as outfile:
in_csv = csv.reader(infile)
out_csv = csv.writer(outfile)
column_names = next(in_csv)
out_csv.writerow(column_names)
id_index = column_names.index("id")
name_index = column_names.index("name")
try:
row_1 = next(in_csv)
written_row = False
for row_2 in in_csv:
if first_word(row_1[name_index]) == first_word(row_2[name_index]) and row_1[id_index] != row_2[id_index]:
if not written_row:
out_csv.writerow(row_1)
out_csv.writerow(row_2)
written_row = True
else:
written_row = False
row_1 = row_2
except StopIteration:
# No data rows!
pass