我的问题有几个问题需要解决。我需要导入一个包含两个字段的 csv 文件(一个用作 ID 的数字字段,一个用作描述的字符串字段)。然后,将字符串字段转换为单个单词的集合(列表?元组?字典?)并搜索其他集合以计算匹配项。
例子:
id_field | desc_field
1 | some description
2 | some other description
3 | some third other description
我需要的是一个 id_field 匹配列表
id_field 1 has 2 matches in id_field 2
id_field 1 has 2 matches in id_field 3
id_field 2 has 3 matches in id_field 3
ETC
导入csv
文件应该很容易使用:
import csv
reader = csv.reader(open('SOMEFILE.csv'), delimiter=',', quotechar='"'
我确信我可以使用 find 或 in 运算符来查找和计算单词,但是我在编写可以让我搜索 csv 字符串字段的代码时遇到了麻烦。