在 sklearn.datasets.make_classification 中,类 y 是如何计算的?假设我运行他的:
from sklearn.datasets import make_classification
X, y = make_classification(n_samples=1000, n_features=2, n_informative=2,
n_classes=2, n_clusters_per_class=1, random_state=0)
用什么公式从 X 中得出 y?该文档在谈到信息功能时涉及到这一点:
信息特征的数量。每个类由许多高斯簇组成,每个高斯簇位于维度为 n_informative 的子空间中超立方体的顶点周围。对于每个集群,信息特征是独立于 N(0, 1) 绘制的,然后随机线性组合以增加协方差。然后将簇放置在超立方体的顶点上。
谢谢,
G