我在一个 numpy 数组中的 17 个特征中的每一个都有 5000 个数据点,从而产生一个 5000 x 17 数组。我正在尝试使用高斯混合找到每个特征的异常值,但我对以下问题感到困惑:1)我的 GaussiasnMixture 应该使用多少个组件?2) 我应该将 GaussianMixture 直接拟合到 5000 x 17 的阵列上还是分别拟合到每个特征列上,从而产生 17 个 GaussianMixture 模型?
clf = mixture.GaussianMixture(n_components=1, covariance_type='full')
clf.fit(full_feature_array)
或者
clf = mixture.GaussianMixture(n_components=17, covariance_type='full')
clf.fit(full_feature_array)
或者
for feature in range(0, full_feature_matrix):
clf[feature] = mixture.GaussianMixture(n_components=1, covariance_type='full')
clf.fit(full_feature_array[:,feature)