我正在做一个项目,该项目要求我将短语或关键字与一组相似的关键字进行匹配。我需要为此执行语义分析。
一个例子:
相关 QT
廉价健康保险
负担得起的健康保险
低成本医疗保险
健康计划,用于更
便宜的健康保险
共同意义
低成本健康保险
这里 Common Meaning 列下的单词应该与 Relevant QT 列下的相匹配。我查看了一堆工具和技术来做同样的事情。S-Match 看起来很有前途,但我必须使用 Python,而不是 Java。潜在语义分析也看起来不错,但我认为它更多地用于基于关键字而不是关键字匹配的文档分类。我对 NLTK 有点熟悉。有人可以提供一些关于我应该前进的方向以及我应该使用哪些工具的见解吗?