我有一个完整的拼写正确的单词列表,称为 ref.txt 。我有一个句子列表,我已经设法使用正则表达式从中提取单词。我会用一个例子来详细说明。
假设 ref.txt 包含 - Mumbai , Andheri ,Jacob Circle, Bandra
。我有一个句子列表,例如-
['Blue Meadows near andhri ', 'Oberoi Heights opp windy road off Bnadra' ,
'Red Heavens club ,behind Mumbia club near Jacob Circle']
没有太多关于水母的文档。
import jellyfish as jf
jf.jaro_distance(andhri,andheri)
问题是,在使用正则表达式提取单词后,我如何将其与整个列表进行比较.. 由于成本最低,我的算法应该自动为 andhri 建议“andheri”..
如果你有其他想法要实现,请做推荐..谢谢