我如何通过相似性知道句子中包含的特定字符串?
- 例如..
ex) 句子:社区在这里帮助您解决特定的编码、算法或语言问题。
特定字符串:algorism
- 跑完之后
相似度:0.8248242(算法 - 算法)
现在,我正在使用 Python&jellyfish。我打算在 Outlook 中检查邮件主题并根据特定的字符串列表对其进行分类。
帮我.................
我如何通过相似性知道句子中包含的特定字符串?
ex) 句子:社区在这里帮助您解决特定的编码、算法或语言问题。
特定字符串:algorism
相似度:0.8248242(算法 - 算法)
现在,我正在使用 Python&jellyfish。我打算在 Outlook 中检查邮件主题并根据特定的字符串列表对其进行分类。
帮我.................
尝试这个 ?
import string
from difflib import SequenceMatcher
def similarity(a, b): # EDIT WITH YOU OWN SIMILARITY OF NOT CORRECT
return SequenceMatcher(None, a, b).ratio()
def max_similar(sentence, string_to_find):
result = ["", 0]
# Remove punctuation
sentence = sentence.translate(str.maketrans('', '', string.punctuation))
# split to list
sentence = sentence.split()
for word in sentence:
coeff = similarity(word, string_to_find)
if coeff > result[1]:
result[0] = word
result[1] = coeff
return result
print(max_similar("The community is here to help you with specific coding, algorithm, or language problems.", "algorism"))
结果 :
['algorithm', 0.8235294117647058]