我正在尝试找到一个字符串指标,以在我的列表中找到与任意输入最相似的条目。看起来最常见的字符串度量对无关字符很重视,即使子字符串完全匹配。例如,“Corvette, red 2013”和“corvette”使用 difflib.get_close_matches() 的匹配存储为 0.11,但“octet rev”和“corvette”的匹配分数为 0.23。
我知道我的列表可能包含无关信息(例如“red 2013”),但我更想知道“corvette”是完全匹配的,而忽略了无关信息。'Octet rev' 对我来说将被视为错误匹配。
是否有任何字符串匹配指标以我需要的方式衡量匹配?更好的是,是否已经在 python 包中实现了一个?