0

对于“如何在 R 中运行此模型”问题,我深表歉意。当谈到统计模型时,我将是第一个承认我是新手的人。希望我有足够多的实质性问题来引起人们的兴趣,并且问题会更像是“R中的这个命令是否对应于这个统计模型?”

我正在尝试估计一个模型,该模型可以估计给定 Twitter 用户“关注”来自给定政党的政治用户的概率。我的数据框位于个人用户级别,每个用户都可以选择关注或不关注 Twitter 上的派对。作为替代特定变量,我测量了与 Twitter 用户和政党之间的意识形态距离,以及指定距离是正面还是负面的交互项。因此,在 Twitter 上关注政客的决定取决于你的意识形态距离。

最初我试图估计一个条件 logit 模型,但我很快就摆脱了这个想法,因为选择不是相互排斥的,即他们可以选择跟随多个政党。现在我怀疑我是否应该使用多项概率或多元概率,因为我希望我的模型允许个人选择多个替代方案。但是,当我尝试估计多项式概率时,我的代码不起作用。我的代码是:

mprobit <- mlogit(Follow ~ F1_Distance+F2_Distance+F1_Distance*F1_interaction+F2_Distance*F2_interaction+strata(id), 
           long, probit = T, seed = 123)

我收到以下错误消息:

Error in dfidx::dfidx(data = data, dfa$idx, drop.index = dfa$drop.index,  : 
  the two indexes don't define unique observations

我已经尝试查找错误,但似乎找不到与概率模型相关的任何内容。你能告诉我我做错了什么吗?再次为我的无知感到抱歉。谢谢您的帮助。

另外,我尝试在下面的代码中复制我的数据框。该数据是针对第一个 Twitter 用户的前 6 个观察结果,但我有一个包含 5181 个用户的数据集,对应于 51810 个观察结果,因为丹麦有 10 个政党。

 id    Alternative  Follow F1_Distance  F2_Distance  F1_interaction    
1 1    alternativet  1     -0.9672566   -1.3101138              0
2 1 danskfolkeparti  0      0.6038972    1.3799961              1             
3 1    konservative  1      1.0759252    0.8665096              1              
4 1    enhedslisten  0     -1.0831657   -1.0815424              0              
5 1 liberalalliance  0      1.5389934    0.8470291              1              
6 1   nyeborgerlige  1      1.4139934    0.9898862              1              

 F2_interaction
1   0
2   1
3   1
4   0
5   1
6   1
>```
4

0 回答 0