0

我有一个与 Kaggle 竞赛数据集相关的项目,该数据集出现在 application_train csv https://drive.google.com/drive/folders/1zYotRg3l_m66JQRrGYi1VkuW0A0tfC4K?usp=sharing

目标是进行逻辑回归。但是,我在数据选择方面遇到了麻烦。

由于我有 122 个变量,我将如何选择最相关的变量?

data = pd.read_csv("C:/Users/migue/Downloads/application_train.csv") Data_head

谢谢

4

0 回答 0