5

算法背后的理论是什么,例如,当你写一个类似的问题时,它会在 stackoverflow 网站上生成建议?你能推荐一些关于这个主题的书吗?

4

2 回答 2

6

你所说的算法主要存在于 3 个AI分支中:NLPMLIR

例如,要找到一个新问题中最相似的 10 个问题,可以从每个问题的文本中提取n-gram ,计算每个问题的 n-gram 的TF-IDF权重向量,然后计算新问题与所有问题之间的余弦相似度其他问题,并选择相似度最高的 10 个问题。

您可以阅读一些免费书籍:http:
//nlp.stanford.edu/IR-book/
http://infolab.stanford.edu/~ullman/mmds.html

以及从 1 月下旬开始的 2 门免费课程:
http :
//www.nlp-class.org/ http://jan2012.ml-class.org/

也(有点参与): http://see.stanford.edu/see/courseinfo.aspx?coll=63480b48-8819-4efd-
8412-263f1a472f5a http://see.stanford.edu/see/courseinfo.aspx
?科尔=348ca38a-3a6d-4052-937d-cb017338d7b1

于 2011-12-28T22:19:11.740 回答
1

我认为这与源自市场篮子分析的关联规则挖掘有关。作为一个很好的参考, Bing Liu 的Web Data Mining绝对是最好的之一。

于 2012-01-10T15:51:35.850 回答