1

Ghahramani 和 Heller ( http://mlg.eng.cam.ac.uk/zoubin/papers/bsets-nips05.pdf ) 提出的贝叶斯集提供了一种基于查询查找项目集的有用方法(例如 dog 会返回cat, pet) 并产生与谷歌集相当的输出。我想知道如何在不首先提供单词(项目)作为查询的情况下使用该方法来查找顶部集合。有人知道贝叶斯集的主动学习,其中确定了密度最高的集吗?

4

1 回答 1

0

贝叶斯集本质上执行特征选择(参见:基于内容的图像检索的简单贝叶斯框架)以对集合中的项目进行排名。并且特征的权重是通过这个集合的种子例子来决定的。没有种子就没有办法做到这一点。所以归结为寻找“种子集”。

为此,您可以在数据中找到“集群”(例如使用 K-means)并将它们的“质心”(或表示集群的数据点)作为种子集提供。基本上,现在您要做的是对每个集群中的项目进行排名(您可以将其称为 topsets)。

于 2016-06-24T16:38:15.377 回答