1

默认情况下,Patsy'sC似乎生成具有表单名称的类别

C(color, Treatment('White'))[T.Green]

至少在提供给 的公式中使用时statsmodels old。有没有办法指定C生成不太详细的类别名称,例如,形式

colorGreen

甚至简单地

Green
4

2 回答 2

2

这个打开有问题。请在那里讨论替代方案。

https://github.com/pydata/patsy/issues/19

于 2014-03-16T16:55:17.743 回答
0

派对迟到了,但对于那些在 2021 年寻找这个的人来说。

如果您准备进行一些争论,您可以拆开 statsmodelSummary对象(在调用summary()拟合模型时返回),将其转换为 DataFrame,然后从那里格式化。

Summary对象有一个tables属性。第一个是拟合的结果,第二个是系数表。这些表有一个as_html()可以传递给 pandas方法的read_html()方法。

df = pd.read_html(your_fitted_model.summary().tables[1].as_html(), header=0)[0]

从那里您可以通过常规字符串和数据框方法去除 patsy 格式。

于 2021-11-01T07:25:26.063 回答