3

在 R 中,您基本上可以编写model='Lottery ~ (Literacy + Wealth + Region)^k'并获取这些变量的每个 k 路组合。

statsmodels支持一些 R 风格的 OLS 回归,但它们似乎不支持^k语法。我有一个大数据集,足够大,无法手动尝试变量组合的做法,并且基本上正在寻找一种自动化交互效果搜索的方法。

4

1 回答 1

1

公式由 statsmodels 直接处理,patsy而不是由 statsmodels 直接处理。

根据 patsy 文档,使用 power(a + b + c + d) ** 3可用于分类变量的交互作用。

请参阅https://patsy.readthedocs.io/en/latest/formulas.html#the-formula-language**中的部分

旁白:Python 中的力量是**和不是^

于 2020-06-09T23:30:50.183 回答