我想计算关键字与简短描述文本的相关性。就效率和易于实施而言,最佳方法是什么。我正在使用 C++?
问问题
2452 次
2 回答
6
简单的解决方案:计算文本中单词的出现次数。
不过,做好工作是谷歌等公司多年来一直在努力解决的难题。如果可能的话,您可能想看看使用他们的技术
要扩展,请尝试以下操作:
- 使用字典(例如WordNet将所有同义词替换为常用词
- 使用Levenshtein 距离检测相似词
这仍然只会让你到目前为止。您需要执行一些自然语言处理才能真正理解描述将要区分包含相同次数关键字的多个文本。
于 2010-12-28T13:07:58.343 回答
3
请参阅这些以前的 Stack Overflow 问题:
于 2010-12-28T13:07:33.160 回答