所以这是我的问题。我建立了一个很好的数据集,但我在从中提取必要的见解时遇到了一些麻烦。我已经建立了一个包含荷兰重新开发住宅区的数据集。我将所有网站分为七种类型。对于每个站点,我都知道那里构建了哪种类型。此外,我知道每个站点的建筑类型每平方米的利润是多少。最重要的是,我知道每个站点的每平方米利润(如果在那里建造了其他类型)。对于每个站点,我也有一组特征。
总之,我对每个站点都有:
- 那里建造了哪种开发类型
- 那项发展的利润是多少
- 该地点的其他开发类型的利润
- 一组特征
所以我要分析的是利润对选择的开发类型有什么影响。
首先,我想我想使用多项式 logit 模型。
mlogit realised_type profit_type1 profit_type2 profit_type3, baseoutcome(1)
所以我认为这给出了每个开发选项的利润对某个开发是否已经实现的影响。
我的博士导师建议我应该使用有条件的 logit。为此,我使用 Profit_type1、profit_type2 等将宽数据转换为长数据,创建变量替代品
reshape long profit_type, i(site_id) j(alternative)
然后这个:
clogit realised_type profit_type, group(site_id)
但是在这里我错过了一些表明利润对应于哪种类型的东西。
有人可以将我推向正确的方向,或者知道我怎样才能做得更好吗?