0

我有一个非常大的数据集,我希望在数据集中使用不同的特征。我有 15 个功能并希望使用 VotingClassfier 方法。在投票分类器方法中,我想使用 LinearSVC 和 Logistic 回归。这就是我的目标:

数据集 = df1(9 个特征)

克隆数据集 = df2(6 个特征)

clf1 = CalibratedClassifierCV(LinearSVC()).fit(dataset, y1)
clf2 = CalibratedClassifierCV(LogisticRegression()).fit(dataset, y1)
clf = VotingClassifier(estimators=[("svc", clf1), ("lr", clf2)], weights=[2, 1],voting="soft")
clf.fit(cloneddataset, y2)
score = clf.score(cloneddataset, y2)
print("Score: ", score)

这意味着我想使用具有 9 个特征的数据集来首先训练两个模型,然后使用克隆的数据集来训练 VotingClassfier。

拜托,我是 python 和机器学习新手,我不知道这是否有意义。程序执行了,但我不知道它背后的逻辑。此外,它产生的结果与单独逻辑回归的结果相同。

我在这里犯了什么错误吗?

谢谢

4

0 回答 0