我想测试选民投票支持特定政党“XY”的动机,以及居住在某个地区是否会产生重大影响。问题是,来自 A 区(编码为“1”)的选民与 B 区(编码为“0”)的选民的动机是否存在显着差异。
这是我的数据的结构(过度简化):
region_AB motive voter_attribute vote_for_party_XY
1 1 1 1
1 0 1 1
1 1 0 0
0 0 0 0
0 0 1 0
0 1 0 0
我的猜测是在 R 中运行一个二元逻辑、分层模型,但是我将如何确定不同的动机和选民特征是否对 A 区和 B 区的公民起作用?我不只是想测试区域效应,而是测试区域在整个模型中的差异。
或者我可以简单地在标准逻辑回归模型中抛出交互项(例如region*motive1
,region*motive2
...)?
但在这种情况下,我可以添加多少交互项?我是否必须将“区域”中的零重新编码为类似于0.0000000001
零的乘法会扭曲结果?最后,我是否必须将交互项与该交互项的两个组成部分(例如region
、motive
和region*motive
)一起放入模型中,还是只会导致多重共线性?
谢谢!