根据一篇论文,它应该可以工作。但是作为scikit-learn包的学习者..我不明白。所有示例代码都由椭圆或圆圈组成,如下所示。
我真的很想知道如何通过不同的模式对以下图进行聚类... 0 -3 是特定时间段内的功率平均值(分为 4 个),而 4、5、6 分别对应于一年的标准偏差,工作日/周末的差异,冬季/夏季的差异。所以ylabel不一定会遇到4,5,6。
在样本之后..BIC 确实生成了最佳聚类数为 5。
n_components = np.arange(1, 21)
models = [GMM(n, covariance_type='full', random_state=0).fit(input)
for n in n_components]
plt.plot(n_comp, [m.bic(read) for m in models], label = 'BIC')
plt.legend(loc='best')
plt.xlabel('n_components')
但是,如果我使用可用的示例代码进行绘图.. 它会返回一些完全奇怪的东西,不值得分享。我虽然负 BIC 没问题。但我什至不知道它是否正确聚类以推断出 5 是最佳数字。