1

我正在使用 Python 3.2 版。有以下代码:

for row2 in reader2:
    for row1 in reader1:
        if row1['identification_column'] == row2['identification_column']:
            row2['updated_col'] = row1['updated_col']
    writer.writerow(row2)

reader1 是一个 csv.DictReader 对象,如下所示:

    identification_column,type

    1, bike                       
    2, guitar
    3, drums
    4, airplane
    5, computer

reader2 与 reader1 类似,但文件更长、更全面。

问题是这样的:

我遍历了所有的内循环,如果程序没有找到匹配项,它就不会写行,然后像我想的那样递增外循环。它只是停止。最初它给了我一个错误,直到我在这里阅读了一篇帖子,其中有人建议在作者声明语句中添加“extrasaction = 'ignore'”。但这并没有解决我的问题。

对于修复此逻辑的任何反馈,我将不胜感激。在我看来,以下是将会发生的事情:

A)在内循环没有从外循环中找到有问题的值的情况下,程序输出外循环中的行而不做任何更改

B)如果内部循环具有外部循环正在迭代的确切值,请更改该行中的一列中的值,然后输出该行

我可以看到,程序只是在内循环的第一次迭代后停止,但我不明白为什么会这样。

4

2 回答 2

3

reader1并且reader2是文件对象(包装在csvDictReader 中)。这些是只能读取一次的迭代器(直到您位于文件末尾),因此下一个for循环无需执行任何操作。

解决方案:

将文件读入列表并使用它来刷新DictReader

read_1 = myfile1.readlines()
for row2 in reader2:
    reader1 = csv.DictReader(read_1)
    for row1 in reader1:
        # etc.

更好的是,将该 csv 文件读入字典列表一次 - 这应该更快:

reader1 = list(csv.DictReader(myfile))
for row2 in reader2:
    for row1 in reader1:
        # etc.
于 2012-09-21T20:54:16.137 回答
2

我没有经验csv,但我猜reader一旦你迭代到最后一行,它就已经用尽了,然后你需要重新启动它才能再次迭代。reader1所以,也许你应该在内部循环中使用它之前尝试重新分配:

for row2 in reader2:
    reader1 = csv.DictReader(open('my.csv'), ...)
    for row1 in reader1:
于 2012-09-21T20:54:08.363 回答