我有一个 mysql 数据库,我在其中添加新闻文章,在添加之前,它会尝试将该文章与 100 篇最后一篇文章进行比较,如果它有任何相似之处。
因此,如果相似度为 95%,我可以将其标记为 与文章 122相同,或者如果相似度为 70-95%,我可以将其标记为与文章 133相似,
这是最好的方法:
有没有mysql可以做到的方法或功能
我是否需要使用 python 在while循环中将那篇文章与其他 100 篇文章进行比较
正如我在论坛中看到的那样,python 是最好的方法,但我尝试了一些库来比较 string1(article1) 和 string2(article2),即使它完全不同的文章告诉我它是 70% 相同
我认为这是因为一些相同的词,例如:and , he ,she, will, news,text,or,and, the, i