2

正在解决这个问题,我需要根据他们正在寻找的内容对搜索短语进行聚类(现在,假设他们只在寻找地方,例如书店、超市……)

“我在哪里可以找到芝士蛋糕?”
可以概率地聚集到“甜点”、“餐厅”、...

“我在哪里可以买到杂货?”
可以概率地聚集到“超市”、“蔬菜”、...

假设一开始,一组搜索短语可以被分类到的内容已经存在。

我研究了主题建模,但我觉得我可能走错了方向。任何关于如何开始/研究什么的建议都会非常有帮助。

非常感谢。

4

1 回答 1

0

主题建模当然提供了一种可能的解决方案。从大型语料库中归纳出一个主题模型,尽可能代表您正在索引和搜索的文本。然后将每个查询表示为给定查询的主题的后验。如果您想获得查询集群,则可以在这个简化的集合上执行此操作,或者如果您正在执行 IR,您可以使用结果向量而不是原始的词袋。

如果这不是你想要的,你能详细说明问题吗?您希望如何处理集群查询?

于 2012-11-09T10:40:33.677 回答