在 R 中,您基本上可以编写model='Lottery ~ (Literacy + Wealth + Region)^k'
并获取这些变量的每个 k 路组合。
statsmodels
支持一些 R 风格的 OLS 回归,但它们似乎不支持^k
语法。我有一个大数据集,足够大,无法手动尝试变量组合的做法,并且基本上正在寻找一种自动化交互效果搜索的方法。
在 R 中,您基本上可以编写model='Lottery ~ (Literacy + Wealth + Region)^k'
并获取这些变量的每个 k 路组合。
statsmodels
支持一些 R 风格的 OLS 回归,但它们似乎不支持^k
语法。我有一个大数据集,足够大,无法手动尝试变量组合的做法,并且基本上正在寻找一种自动化交互效果搜索的方法。
公式由 statsmodels 直接处理,patsy
而不是由 statsmodels 直接处理。
根据 patsy 文档,使用 power(a + b + c + d) ** 3
可用于分类变量的交互作用。
请参阅https://patsy.readthedocs.io/en/latest/formulas.html#the-formula-language**
中的部分
旁白:Python 中的力量是**
和不是^