过程的一部分需要应用字符串相似度算法。
这个过程的结果将被存储并产生让我们说 SS_Dataset。
基于此数据集,必须做出进一步的决定。
我的问题是:
我应该应用一种或多种字符串相似性算法来生成 SS_Dataset 吗?
计算“距离”和“听起来像”相似度的算法之间的任何比较?
一组算法是否比另一组产生更准确的结果?组合是否能提供更准确的相似性结果?
- 你能推荐你使用过的实现吗?
我的实现将包括来自以下库的包
过程的一部分需要应用字符串相似度算法。
这个过程的结果将被存储并产生让我们说 SS_Dataset。
基于此数据集,必须做出进一步的决定。
我的问题是:
我应该应用一种或多种字符串相似性算法来生成 SS_Dataset 吗?
计算“距离”和“听起来像”相似度的算法之间的任何比较?
一组算法是否比另一组产生更准确的结果?组合是否能提供更准确的相似性结果?
我的实现将包括来自以下库的包