algorithm - StackOverflow 使用什么算法来查找类似问题？

Question

我需要在我正在构建的网站中为客户创建一个帮助台，我喜欢 StackOverflow 找到类似问题的方式。有谁知道该网站使用什么算法，你能提供任何参考资料吗？

score 5 · Accepted Answer

有一个Machine Learning名为clustering（一种类型unsupervised learning）的完整分支来处理此类问题。

该问题成为集群的一部分，同一集群中的其他问题（可能按similarity measure距离顺序）显示为类似问题。

features它可以用于集群的各种方法，其中一些可能是：

等等。

在这类问题中，可能还有其他使用诸如text summarization、sentiment analysis等技术的公式化特征。哪些功能对哪个问题有好处取决于问题。

您可以看到这些算法在运行的其他领域是：

并且列表继续无穷大。

那么你能做些什么来解决你的问题呢？

没有一个答案。这完全取决于您的数据和目标查询。但是，你仍然可以

（这些有很多在线课程。）

或者

score 1 · Accepted Answer

大多数可能是标签上的加权匹配，也许是 match() 或标题上的等效全文加权搜索。

它可能在某个地方的元数据或常见问题解答中得到了它的详细信息

2 回答 2