输入问题时,stackoverflow 会向您显示它认为可能涵盖同一主题的问题列表。我在其他站点或其他程序中也看到了类似的功能(例如,帮助文件系统),但我自己从未编写过类似的东西。现在我很想知道一个人会使用什么样的算法。
我想到的第一个方法是将短语拆分为单词并查找包含这些单词的短语。在你这样做之前,你可能想扔掉无关紧要的词(比如'the'、'a'、'does'等),然后你会想要对结果进行排名。
嘿,等等 - 让我们为网页做这个,然后我们可以有一个...... watchamacallit ... - 一个“搜索引擎”,然后我们可以销售广告,然后......
不,说真的,解决这个问题的常用方法是什么?