如果不是正确的地方,我很抱歉,但我没有在其他地方找到答案。我想知道我是否理解蒙特卡罗模拟在 chisq.test() 中的使用。
我有一个定性变量,它有 128 个级别/类。我的样本量是 26(我无法对更多“个人”进行抽样)。所以很明显,我会有一些“个人”为0的级别。但事实是,在 127 个可能的类别中,我只代表了极少数的类别。据说(我不完全理解其原因)要应用卡方检验,每个级别至少应该有 5 个人,我想我必须使用模拟.p.value 选项(在 R 中)来使用蒙特卡罗模拟来估计分布并计算 p 值。如果没有蒙特卡罗模拟,R 给我一个 p 值 < 1e-16。使用蒙特卡洛模拟,它给了我一个 4e-5 的 p 值。
我尝试用 26 个 1 和 101 个 0 的向量计算 p 值,通过蒙特卡洛模拟,我得到一个 1 的 p 值。
是否可以这样说,即使我的样本量与可能的类别数量相比很小,观察到的分布也使得所有可能的类别不太可能以相同的概率(1/127)存在于现实中人口 ?
谢谢你的帮助
朱利安