python - 使用文本文件中的数据交叉匹配和删除 csv 中的行

Question

我有一个问题，我目前不知道如何实现。我需要根据两列中的匹配数据从 csv 中删除行。

因此，如果文本文件显示为：

London
James Smith, John Oliver, John-Smith-Harrison

Paris
Hermione, Trevor Wilson

New York city
Charlie Chaplin, Ned Stark, Thoma' Becket, Ryan-Dover

然后 csv 将根据匹配城市名称与第二列以及匹配第 9 列中的名称来删除一行。

我希望这是一个相对简单的功能。如果有人可以提供如何执行此操作的示例，将不胜感激。亲切的问候 AEA

score 1 · Accepted Answer

这是一个例子。它假设 csv 文件名为“input.csv”，并且它写入文件“output.csv”中与“Paris”、“Trevor Wilson”不匹配的行。

它使用来自itertools 文档grouper的配方将行组合成 3 组。

请注意，由于没有明确定义的标准，csv 文件的语法差异很大。csv如果您的真实输入文件与您发布的示例不匹配，则值得查看该模块的文档。例如，我使用该skipinitialspace选项告诉解析器在分隔符之后立即忽略空格。

import csv
from itertools import *

# see recipies section in itertools docs
# http://docs.python.org/2/library/itertools.html
def grouper(iterable, n, fillvalue=None):
    "Collect data into fixed-length chunks or blocks"
    # grouper('ABCDEFG', 3, 'x') --> ABC DEF Gxx
    args = [iter(iterable)] * n
    return izip_longest(fillvalue=fillvalue, *args)

with open('input.csv') as f:
    data = csv.reader(f, skipinitialspace=True)
    with open('output.csv', 'w') as output_f:
        output = csv.writer(output_f)
        for city, names, blank in grouper(data, 3, []):
            if not (city[0] == 'Paris' and 'Trevor Wilson' in names):
                output.writerow(city)
                output.writerow(names)
                output.writerow('')

python - 使用文本文件中的数据交叉匹配和删除 csv 中的行

1 回答 1

Related

Reference