r - 您如何在 R 中组织数据并运行多项式概率？

Question

对于“如何在 R 中运行此模型”问题，我深表歉意。当谈到统计模型时，我将是第一个承认我是新手的人。希望我有足够多的实质性问题来引起人们的兴趣，并且问题会更像是“R中的这个命令是否对应于这个统计模型？”

我正在尝试估计一个模型，该模型可以估计给定 Twitter 用户“关注”来自给定政党的政治用户的概率。我的数据框位于个人用户级别，每个用户都可以选择关注或不关注 Twitter 上的派对。作为替代特定变量，我测量了与 Twitter 用户和政党之间的意识形态距离，以及指定距离是正面还是负面的交互项。因此，在 Twitter 上关注政客的决定取决于你的意识形态距离。

最初我试图估计一个条件 logit 模型，但我很快就摆脱了这个想法，因为选择不是相互排斥的，即他们可以选择跟随多个政党。现在我怀疑我是否应该使用多项概率或多元概率，因为我希望我的模型允许个人选择多个替代方案。但是，当我尝试估计多项式概率时，我的代码不起作用。我的代码是：

mprobit <- mlogit(Follow ~ F1_Distance+F2_Distance+F1_Distance*F1_interaction+F2_Distance*F2_interaction+strata(id), 
           long, probit = T, seed = 123)

我收到以下错误消息：

Error in dfidx::dfidx(data = data, dfa$idx, drop.index = dfa$drop.index,  : 
  the two indexes don't define unique observations

我已经尝试查找错误，但似乎找不到与概率模型相关的任何内容。你能告诉我我做错了什么吗？再次为我的无知感到抱歉。谢谢您的帮助。

另外，我尝试在下面的代码中复制我的数据框。该数据是针对第一个 Twitter 用户的前 6 个观察结果，但我有一个包含 5181 个用户的数据集，对应于 51810 个观察结果，因为丹麦有 10 个政党。

 id    Alternative  Follow F1_Distance  F2_Distance  F1_interaction    
1 1    alternativet  1     -0.9672566   -1.3101138              0
2 1 danskfolkeparti  0      0.6038972    1.3799961              1             
3 1    konservative  1      1.0759252    0.8665096              1              
4 1    enhedslisten  0     -1.0831657   -1.0815424              0              
5 1 liberalalliance  0      1.5389934    0.8470291              1              
6 1   nyeborgerlige  1      1.4139934    0.9898862              1              

 F2_interaction
1   0
2   1
3   1
4   0
5   1
6   1
>```

r - 您如何在 R 中组织数据并运行多项式概率？

0 回答 0

Related

Reference