pandas - 我可以在集成学习中为不同的机器学习模型使用不同的数据集吗？

问问题 2021-10-22T06:54:31.980

17 次

我有一个非常大的数据集，我希望在数据集中使用不同的特征。我有 15 个功能并希望使用 VotingClassfier 方法。在投票分类器方法中，我想使用 LinearSVC 和 Logistic 回归。这就是我的目标：

数据集 = df1（9 个特征）

克隆数据集 = df2（6 个特征）

clf1 = CalibratedClassifierCV(LinearSVC()).fit(dataset, y1)
clf2 = CalibratedClassifierCV(LogisticRegression()).fit(dataset, y1)
clf = VotingClassifier(estimators=[("svc", clf1), ("lr", clf2)], weights=[2, 1],voting="soft")
clf.fit(cloneddataset, y2)
score = clf.score(cloneddataset, y2)
print("Score: ", score)

这意味着我想使用具有 9 个特征的数据集来首先训练两个模型，然后使用克隆的数据集来训练 VotingClassfier。

拜托，我是 python 和机器学习新手，我不知道这是否有意义。程序执行了，但我不知道它背后的逻辑。此外，它产生的结果与单独逻辑回归的结果相同。

我在这里犯了什么错误吗？

谢谢

pandas - 我可以在集成学习中为不同的机器学习模型使用不同的数据集吗？

0 回答 0

Related

Reference