python - 如何选择相关变量以对非常大的数据集应用逻辑回归

翻译自：https://stackoverflow.com/questions/70207631 2021-12-02T23:13:58.850

12 次

0

我有一个与 Kaggle 竞赛数据集相关的项目，该数据集出现在 application_train csv https://drive.google.com/drive/folders/1zYotRg3l_m66JQRrGYi1VkuW0A0tfC4K?usp=sharing

目标是进行逻辑回归。但是，我在数据选择方面遇到了麻烦。

由于我有 122 个变量，我将如何选择最相关的变量？

data = pd.read_csv("C:/Users/migue/Downloads/application_train.csv") Data_head

谢谢

0 回答 0