对于“如何在 R 中运行此模型”问题,我深表歉意。当谈到统计模型时,我将是第一个承认我是新手的人。希望我有足够多的实质性问题来引起人们的兴趣,并且问题会更像是“R中的这个命令是否对应于这个统计模型?”
我正在尝试估计一个模型,该模型可以估计给定 Twitter 用户“关注”来自给定政党的政治用户的概率。我的数据框位于个人用户级别,每个用户都可以选择关注或不关注 Twitter 上的派对。作为替代特定变量,我测量了与 Twitter 用户和政党之间的意识形态距离,以及指定距离是正面还是负面的交互项。因此,在 Twitter 上关注政客的决定取决于你的意识形态距离。
最初我试图估计一个条件 logit 模型,但我很快就摆脱了这个想法,因为选择不是相互排斥的,即他们可以选择跟随多个政党。现在我怀疑我是否应该使用多项概率或多元概率,因为我希望我的模型允许个人选择多个替代方案。但是,当我尝试估计多项式概率时,我的代码不起作用。我的代码是:
mprobit <- mlogit(Follow ~ F1_Distance+F2_Distance+F1_Distance*F1_interaction+F2_Distance*F2_interaction+strata(id),
long, probit = T, seed = 123)
我收到以下错误消息:
Error in dfidx::dfidx(data = data, dfa$idx, drop.index = dfa$drop.index, :
the two indexes don't define unique observations
我已经尝试查找错误,但似乎找不到与概率模型相关的任何内容。你能告诉我我做错了什么吗?再次为我的无知感到抱歉。谢谢您的帮助。
另外,我尝试在下面的代码中复制我的数据框。该数据是针对第一个 Twitter 用户的前 6 个观察结果,但我有一个包含 5181 个用户的数据集,对应于 51810 个观察结果,因为丹麦有 10 个政党。
id Alternative Follow F1_Distance F2_Distance F1_interaction
1 1 alternativet 1 -0.9672566 -1.3101138 0
2 1 danskfolkeparti 0 0.6038972 1.3799961 1
3 1 konservative 1 1.0759252 0.8665096 1
4 1 enhedslisten 0 -1.0831657 -1.0815424 0
5 1 liberalalliance 0 1.5389934 0.8470291 1
6 1 nyeborgerlige 1 1.4139934 0.9898862 1
F2_interaction
1 0
2 1
3 1
4 0
5 1
6 1
>```