使用 Python 进行离散选择分析。通常,有两种表示回归数据的格式:
- 长格式
- 宽幅
长格式为每个潜在选项提供一行,加上一个 Y 列,根据选择为 0 或 1。宽幅每人(受访者)只有一行,Y 包含所有选择的功能,X 包含所有产品替代品。
示例长
person answer Y ~ x1 x2
1 1 0 green large
1 1 1 red large
1 2 1 green small
...
示例宽
y1 y2 ~ x11 x12 x21 x22
green large green large red large
green small green small red small
...
- 我的描述正确吗?
- statsmodel mlogit 是否使用此处描述的宽格式?