我在 sklearn 中训练了一个逻辑回归分类器。我的基本特征文件有 65 个特征,现在我通过考虑二次组合(使用 PolynomialFeatures())将它们外推到 1000。然后我通过 Select-K-Best() 方法将它们减少到 100。
但是,一旦我训练了我的模型并获得了一个新的 test_file,它将只有 65 个基本特征,但我的模型预计其中有 100 个。
那么,当我不知道 Select-K-Best.fit() 函数中所需的标签时,如何在我的测试集上应用 Select-K-Best() 方法