我有两个列表(真的有很多),我需要在它们之间进行匹配。例如:
我有这样的文件:
- 曼联
- 阿森纳足球俱乐部
- 维冈
- ...
第二个列表是这样的:
- 曼彻斯特大学
- 兵工厂
- 维冈足球俱乐部
- ...
所以,我需要查询第二个列表的每个单词是否存在于第一个列表中(如果适用,请更正它)。
我不能使用字典,因为单词列表总是在变化。每个列表词可以有多个词。
我正在寻找一些方法,如 N-gram、拼写检查器等......但我很困惑,因为这些方法逐个字母工作(例如第一个“M”,第二个“Ma”......)而且我不知道是什么做或开始。你如何解决这个问题?问候!