0

我有一个完整的拼写正确的单词列表,称为 ref.txt 。我有一个句子列表,我已经设法使用正则表达式从中提取单词。我会用一个例子来详细说明。
假设 ref.txt 包含 - Mumbai , Andheri ,Jacob Circle, Bandra。我有一个句子列表,例如-

['Blue Meadows near andhri ', 'Oberoi Heights opp windy road off Bnadra' , 
'Red Heavens club ,behind Mumbia club near Jacob Circle']  

没有太多关于水母的文档。

import jellyfish as jf  
jf.jaro_distance(andhri,andheri)

问题是,在使用正则表达式提取单词后,我如何将其与整个列表进行比较.. 由于成本最低,我的算法应该自动为 andhri 建议“andheri”..
如果你有其他想法要实现,请做推荐..谢谢

4

1 回答 1

0

就我所知,您希望您的程序建议最接近用户输入的单词。没有简单的方法可以做到这一点。您必须逐个字符进行比较。将“andhri”中的每个字符与列表中每个单词的字符进行比较。并保留一个柜台。最好是计数器列表对您更有效。将列表中每个单词中的每个字母与“andhri”中的字母进行比较,每次匹配时,增加相应的计数器。将列表中每个单词的每个字符与“andhri”进行比较后,检查计数器。应该向用户建议对应于最高计数器的单词。

于 2014-02-05T09:30:25.870 回答