默认情况下,Patsy'sC
似乎生成具有表单名称的类别
C(color, Treatment('White'))[T.Green]
至少在提供给 的公式中使用时statsmodels
old
。有没有办法指定C
生成不太详细的类别名称,例如,形式
colorGreen
甚至简单地
Green
默认情况下,Patsy'sC
似乎生成具有表单名称的类别
C(color, Treatment('White'))[T.Green]
至少在提供给 的公式中使用时statsmodels
old
。有没有办法指定C
生成不太详细的类别名称,例如,形式
colorGreen
甚至简单地
Green
这个打开有问题。请在那里讨论替代方案。
派对迟到了,但对于那些在 2021 年寻找这个的人来说。
如果您准备进行一些争论,您可以拆开 statsmodelSummary
对象(在调用summary()
拟合模型时返回),将其转换为 DataFrame,然后从那里格式化。
Summary
对象有一个tables
属性。第一个是拟合的结果,第二个是系数表。这些表有一个as_html()
可以传递给 pandas方法的read_html()
方法。
df = pd.read_html(your_fitted_model.summary().tables[1].as_html(), header=0)[0]
从那里您可以通过常规字符串和数据框方法去除 patsy 格式。