当我尝试使用外来字符的简单模糊模糊表达式时,使用 process.extractOne 方法得到错误结果(我尝试过使用和不使用 u):
>>> choices= [u"הלכות חנוכה",u"הלכות פורים",u"הלכות סוכה"]
>>> process.extractOne("הלכות סוכה", choices)
(u'\u05d4\u05dc\u05db\u05d5\u05ea \u05d7\u05e0\u05d5\u05db\u05d4', 0)
然而,对于 fuzz.ratio,它运行平稳:
>>> fuzz.ratio("הלכות ראש השנה", "הלכות תעניות")
69
相同的代码适用于常规字符:
>>> choices= ['this','that','those']
>>> process.extractOne("these", choices)
('those', 80)
可能是什么问题?