我正在使用 GMM 对我的数据集进行聚类,并尝试找到它,结果在测试数据集和训练数据集之间是一致的。
我得到这样的集群:
正如您所看到的,在测试数据集和训练数据集之间似乎有一些集群分布很重要。
但我不知道如何定量比较它们之间的不同集群:我计算了火车和每个集群中的测试分布之间的一些 wasserstein_distance,以查看每个集群在火车和测试之间是否一致。
但我没有设法比较它们之间的不同集群以找到一些意义。
你知道我能做什么吗?谢谢!
我正在使用 GMM 对我的数据集进行聚类,并尝试找到它,结果在测试数据集和训练数据集之间是一致的。
我得到这样的集群:
正如您所看到的,在测试数据集和训练数据集之间似乎有一些集群分布很重要。
但我不知道如何定量比较它们之间的不同集群:我计算了火车和每个集群中的测试分布之间的一些 wasserstein_distance,以查看每个集群在火车和测试之间是否一致。
但我没有设法比较它们之间的不同集群以找到一些意义。
你知道我能做什么吗?谢谢!