montecarlo - 对卡方检验应用 p 值的蒙特卡罗模拟的规则

翻译自：https://stackoverflow.com/questions/17256533 2013-06-23T00:05:53.497

956 次

如果不是正确的地方，我很抱歉，但我没有在其他地方找到答案。我想知道我是否理解蒙特卡罗模拟在 chisq.test() 中的使用。

我有一个定性变量，它有 128 个级别/类。我的样本量是 26（我无法对更多“个人”进行抽样）。所以很明显，我会有一些“个人”为0的级别。但事实是，在 127 个可能的类别中，我只代表了极少数的类别。据说（我不完全理解其原因）要应用卡方检验，每个级别至少应该有 5 个人，我想我必须使用模拟.p.value 选项（在 R 中）来使用蒙特卡罗模拟来估计分布并计算 p 值。如果没有蒙特卡罗模拟，R 给我一个 p 值 < 1e-16。使用蒙特卡洛模拟，它给了我一个 4e-5 的 p 值。

我尝试用 26 个 1 和 101 个 0 的向量计算 p 值，通过蒙特卡洛模拟，我得到一个 1 的 p 值。

是否可以这样说，即使我的样本量与可能的类别数量相比很小，观察到的分布也使得所有可能的类别不太可能以相同的概率（1/127）存在于现实中人口？

谢谢你的帮助

朱利安

montecarlo - 对卡方检验应用 p 值的蒙特卡罗模拟的规则

0 回答 0

Related

Reference