我需要在我正在构建的网站中为客户创建一个帮助台,我喜欢 StackOverflow 找到类似问题的方式。有谁知道该网站使用什么算法,你能提供任何参考资料吗?
问问题
1742 次
2 回答
5
有一个Machine Learning
名为clustering
(一种类型unsupervised learning
)的完整分支来处理此类问题。
该问题成为集群的一部分,同一集群中的其他问题(可能按similarity measure
距离顺序)显示为类似问题。
features
它可以用于集群的各种方法,其中一些可能是:
- 标签
- 标题中的词
- 文本中的单词(重量小于标题)
- 其他问题/网页的链接。
等等。
在这类问题中,可能还有其他使用诸如text summarization
、sentiment analysis
等技术的公式化特征。哪些功能对哪个问题有好处取决于问题。
您可以看到这些算法在运行的其他领域是:
- YouTube
- 维基百科
- 数据库
并且列表继续无穷大。
那么你能做些什么来解决你的问题呢?
没有一个答案。这完全取决于您的数据和目标查询。但是,你仍然可以
- 了解.
feature engineering
_machine learning
- 了解
clustering
.
(这些有很多在线课程。)
或者
- 雇用一个知道这些东西的人。
于 2013-04-24T17:53:01.377 回答
1
大多数可能是标签上的加权匹配,也许是 match() 或标题上的等效全文加权搜索。
它可能在某个地方的元数据或常见问题解答中得到了它的详细信息
于 2013-04-24T15:54:51.690 回答