0

我想了解学生在特定考试中的表现与辍学率之间是否存在关系。我有一个 2×2 矩阵,其中变量 Level in test 取值 level 1 和 level 2,变量 dropout 的值不是 active 和 active。(你可以说1级=通过测试,2级=未通过)。

我可以看到我对“辛普森悖论”这个术语有疑问,因为我知道教职员工的每一次教育都有一个很高的 p 值,这表明考试水平和辍学之间没有关系。但是当我对数据进行分组并对整个教师进行分析时,我得到一个低 p 值,表明变量之间存在显着的关系。?? 我试图阅读有关辛普森悖论的信息,但我似乎没有得到如何处理这个问题的信息?我读过一个地方不应该对聚合数据执行测试,但那不是真的吗? 在此处输入图像描述

我真的希望有人能帮助我!

亲切的问候玛丽亚

4

2 回答 2

0

由于“教师”中的病例总数较高,因此数据足以反驳独立假设,因此 p 值较低。当案例数量较少时(您的教育 1 到教育 5 表),没有足够的数据来显示显着性。这里较高的 p 值只是表示差异可能是偶然的。

这不是辛普森悖论的一个例子。

于 2015-02-07T00:48:00.660 回答
0

对于标记为教育 2 和教育 5 的交叉表,您的单元格值小于 5,这违反了运行卡方的假设。关于卡方如何足够强大以承受这些限制的测试存在争议,但我仍然会重新考虑您的分组方法。

于 2014-06-25T14:05:36.227 回答