我正在尝试使用 statsmodel.api.Logit 在 Python 中应用逻辑回归。我遇到了错误 ValueError: array must not contain infs or NaNs。
当我执行时:
data['intercept'] = 1.0
train_cols = data.columns[1:]
logit = sm.Logit(data['admit'], data[train_cols])
result = logit.fit(start_params=None, method='bfgs', maxiter=20, full_output=1, disp=1, callback=None)
数据包含超过 15000 列和 2000 行。其中 data['admit'] 是目标值, data[train_cols] 是特征列表。谁能给我一些提示来解决这个问题?