machine-learning - 贝叶斯集和寻找顶集

Question

Ghahramani 和 Heller ( http://mlg.eng.cam.ac.uk/zoubin/papers/bsets-nips05.pdf ) 提出的贝叶斯集提供了一种基于查询查找项目集的有用方法（例如 dog 会返回cat, pet) 并产生与谷歌集相当的输出。我想知道如何在不首先提供单词（项目）作为查询的情况下使用该方法来查找顶部集合。有人知道贝叶斯集的主动学习，其中确定了密度最高的集吗？

score 0 · Accepted Answer

贝叶斯集本质上执行特征选择（参见：基于内容的图像检索的简单贝叶斯框架）以对集合中的项目进行排名。并且特征的权重是通过这个集合的种子例子来决定的。没有种子就没有办法做到这一点。所以归结为寻找“种子集”。

为此，您可以在数据中找到“集群”（例如使用 K-means）并将它们的“质心”（或表示集群的数据点）作为种子集提供。基本上，现在您要做的是对每个集群中的项目进行排名（您可以将其称为 topsets）。

machine-learning - 贝叶斯集和寻找顶集

1 回答 1

Related

Reference