-1

我们有一组带有出租车位置的序列。我们希望通过考虑数据行中的顺序模式来对数据进行聚类。例如:T1、T2、T3、T4 是行程,a、b、c、d、e 是一组地点。我们拥有的数据是这样的,

  • T1 bcbad
  • T2一
  • T3 abababced
  • T4 bcdcbdca

但问题是数据的长度是不可变的。我们如何使用 EM 对这些类型的数据进行聚类。由于它不接受可变长度数据,因此我们可以自定义它。

4

1 回答 1

1

EM是一个普遍的原则。您可以将它与非常不同的模型一起使用。

可能最流行的 EM 模型是高斯混合建模,GMM。

自然,如果你使用协方差,GMM需要一个固定的维度。

但是,如果您使用其他模型,它没有理由不能与可变长度向量一起使用。例如,有处理文本数据的 EM 变体,而文本通常确实有不同的长度。

于 2015-08-25T11:03:18.263 回答