1

请耐心等待,因为我是这个级别的统计数据和 Python 的新手。我已经阅读了 statsmodels 和 patsy 的所有文件,但仍有疑问。

我正在尝试使用 statsmodels MixedLM 分析纵向数据。简化一点,我有 5 个变量,自变量之间没有共线性:

  • 结果:因变量。
  • 患者:随机效应,因为每个患者都对结果进行了多次测量
  • 时间:固定效应
  • 有针对性:固定效应,0 = 否,1 = 是,患者是否是针对结果进行干预的目标
  • 性别:固定效应,0=男性,1=女性

我想知道两件事:

  1. 患者是否被靶向与随时间推移的结果趋势之间是否存在关联?
  2. 随着时间的推移,患者性别和结果趋势之间是否存在关联,仅在目标群体中?

也许很重要:我实际上并没有试图做出任何预测。只是准确地解释我已经拥有的数据。

为了回答第一个问题,我尝试了:

md = smf.mixedlm('outcome ~ time * targeted', df, groups = df['patient'])

这个符号正确吗?或者我应该使用:

md = smf.mixedlm('outcome ~ time : targeted', df, groups = df['patient'])

更好地比较结果趋势的差异?或者是其他东西?

为了回答第二个问题,我尝试了:

md = smf.mixedlm('outcome ~ time * targeted * sex', df, groups = df['patient'])

但我认为这是不正确的,因为系数没有意义。目标患者的起始结果需要> 6,但目标:性别的系数< 6。一种解决方案是制作一个仅包含目标患者的单独数据框,但我很好奇是否有操作员我可以在这里用不同的方式得到我想要的。

谢谢!

4

0 回答 0