Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我理解 Dirichlet 过程组选择,如下所述:如何在 Dirichlet 过程聚类中决定组分配
但我不明白为什么 DP 组选择算法不使用新项目的功能来确定最佳组成员资格。如果 DP 不使用成员的特征来指导群组成员资格,它将如何找到不同的群组?
“生成模型”不是标记新项目的程序。
这是一个生成“假”数据的假设程序。如果要生成数据,则必须首先选择组,然后生成属性。没有您可以使用的“现有”功能。
要标记观察到的数据,您必须推断最有可能生成这些新数据的参数(如果它是随机生成的)。
在最初将项目放入随机集群之后,训练阶段将项目一次移动到它们最接近的集群,或者如果与现有集群不紧密匹配,则将它们放入新集群中。训练阶段一直运行到收敛(没有项目移动到不同的集群)。