我想从语料库中提取相似的词。相似度基于字符串。即,当两个词的串高度相似时,将两个词提取为相似词。例如,如果语料库包含:Aras、bahro、arasis、adkpo、bah、aras sd、kio。
相似词:
1-阿拉斯,阿拉西斯,阿拉斯SD
2- 呸,呸
如何解决这个问题呢?谢谢。
我想从语料库中提取相似的词。相似度基于字符串。即,当两个词的串高度相似时,将两个词提取为相似词。例如,如果语料库包含:Aras、bahro、arasis、adkpo、bah、aras sd、kio。
相似词:
1-阿拉斯,阿拉西斯,阿拉斯SD
2- 呸,呸
如何解决这个问题呢?谢谢。