0

我将 LDA 用于分类数据来估计每个类别是否有意义地可分离。

lda = LinearDiscriminantAnalysis(n_components=2)
lda.fit(all_df_scaled, all_df['station'])
df_lda = lda.transform(all_df_scaled)
df_lda_component = pd.DataFrame(df_lda,columns=['x', 'y'])
df_lda_component['target'] = all_df['station']

关键是,我可以做一个图来看看每个类别是如何分开的。但是,为了科学地支持,我想要统计分析中的详细值。从 sklearn LinearDiscriminantAnalysis,我可以打印出 coef_、means_ 等。

可能,我可以总结每个类别系数值的绝对值,并估计类别是如何分离的,但我不确定这种方法是否正确。

另外,我知道有些人使用特征值和正确性以及 P 值和 Wilks Lambda。但我不知道如何生成这些值以及如何解释这些结果。

谁能解释我如何获得这些值(特征值、正确性、Wilks Lamda)以及如何解释这些值?

4

0 回答 0