0

我有许多 CSV 文件,我需要将它们与一个“主列表”进行比较,并根据唯一 ID 确定这些其他文件是否包含该键的条目。

在 Python 中执行此操作的最简单方法是什么?即,您建议我将数据读入哪种结构,以及您建议我如何遍历它?

这是我正在寻找的数据和输出的示例。

**Master List**

Unique ID : File Name : File Version : Responsible Party

J578221 : Expander : 1.23 : Joe Bloggs

KK89821 : Top : 0.9 : Mike Smith


**Location X**

Region : File Name : Unique ID

USA : Acme Expander : J578221

USA : Acme Tail : MK33431

**Location Z**

Reqion : File Name : Unique ID : Date Added

China : Expander : J578221 : 03-04-2012

HK : Acme Top : KK89821 : 06-07-2012

**Output:**

Unique ID : File Name : File Version : Responsible Party : In Location X : In Location Z

J578221 : Expander : 1.23 : Joe Bloggs : YES : YES

KK89821 : Top : 0.9 : Mike Smith : NO : YES
4

1 回答 1

0

最简单的方法可能是使用正则表达式(请参阅此处的文档)来检索主文件中每一行的键。(如果唯一 ID 的位置发生变化,您可能需要先评估文件的结构并修改您的表达式。)

将此 ID 列表作为键存储在字典中,并使用列表作为值,指示包含每个主键的文件。

之后,您可以过滤字典以查找一个或多个文件的 ID(键),或查找包含一个特定 ID 的文件。

于 2013-04-18T12:22:07.637 回答