6

我需要在我正在构建的网站中为客户创建一个帮助台,我喜欢 StackOverflow 找到类似问题的方式。有谁知道该网站使用什么算法,你能提供任何参考资料吗?

4

2 回答 2

5

有一个Machine Learning名为clustering(一种类型unsupervised learning)的完整分支来处理此类问题。

该问题成为集群的一部分,同一集群中的其他问题(可能按similarity measure距离顺序)显示为类似问题。

features它可以用于集群的各种方法,其中一些可能是:

  • 标签
  • 标题中的词
  • 文本中的单词(重量小于标题)
  • 其他问题/网页的链接。

等等。

在这类问题中,可能还有其他使用诸如text summarizationsentiment analysis等技术的公式化特征。哪些功能对哪个问题有好处取决于问题。

您可以看到这些算法在运行的其他领域是:

  • YouTube
  • 维基百科
  • 数据库

并且列表继续无穷大。

那么你能做些什么来解决你的问题呢?

没有一个答案。这完全取决于您的数据和目标查询。但是,你仍然可以

  • 了解. feature engineering_machine learning
  • 了解clustering.

(这些有很多在线课程。)

或者

  • 雇用一个知道这些东西的人。
于 2013-04-24T17:53:01.377 回答
1

大多数可能是标签上的加权匹配,也许是 match() 或标题上的等效全文加权搜索。

它可能在某个地方的元数据或常见问题解答中得到了它的详细信息

于 2013-04-24T15:54:51.690 回答