Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
这个问题并不新鲜,我在这里和这里看到了某种形式的解释。这两种方法都描述了对查询 1 和查询 2 的术语执行 N 克(主要是二元)计算,然后找到余弦相似度。
我希望根据我的理解进行澄清:
我需要获取查询 1 和查询 2 中所有二元组的 TF-IDF 分数,然后使用该分数来计算余弦相似度分数。如果是这样,任何人都可以编写一个简单的python代码以获得更清晰的解释吗?