5

使用 statesmodels 的逻辑回归模型:

log_reg = st.logit(formula = 'label ~ pregnant + glucose + bp + insulin + bmi + pedigree + age', data=pima).fit()

有没有写公式第二部分的简短方法(怀孕+葡萄糖+ bp +胰岛素+ bmi +血统+年龄)?这里必须明确提及所有列。如果超过 100 列,就很难写,而且语句会很长。

4

2 回答 2

4

如果 df 是 pd.DataFrame,并且 y 是目标变量,则此函数将返回您要查找的公式的字符串。

def formula_from_cols(df, y):
    return y + ' ~ ' + ' + '.join([col for col in df.columns if not col==y])
于 2019-04-27T14:47:31.653 回答
0

公式没有特定的快捷方式。

您可以使用 python 字符串操作来构建公式,例如基于 pandas 数据框列名。

或者您直接使用数组或数据框。但即便如此,如果您想要人类可读的输出,例如在summary(). 如果您只需要预测,那么没有变量名的数组很有用。

于 2016-02-20T03:40:48.273 回答