我希望更好地理解 scikit-learn 的 LDA 对象返回的 covariance_ 属性。
我确定我遗漏了一些东西,但我希望它是与输入数据相关的协方差矩阵。但是,当我将 .covariance_ 与 numpy.cov() 返回的协方差矩阵进行比较时,会得到不同的结果。
谁能帮我理解我错过了什么?感谢并乐于提供任何其他信息。
请在下面找到一个说明差异的简单示例。
import numpy as np
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
# Sample Data
X = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]])
y = np.array([1, 1, 1, 0, 0, 0])
# Covariance matrix via np.cov
print(np.cov(X.T))
# Covariance matrix via LDA
clf = LinearDiscriminantAnalysis(store_covariance=True).fit(X, y)
print(clf.covariance_)