如果这不是发布此问题的正确位置,我深表歉意,它与 R 中统计数据计算的数值稳定性有关。
我正在尝试计算非常高的 df2 值的 F 值,但它看起来在数值上不稳定:
nrange <- 350000:450000
f <- qf(1e-8, 8, nrange, lower.tail=FALSE)
plot(f ~ nrange)
看起来像这样:
基本上在附近df2=400000
它不再准确。问题是 - 有人知道我如何解决这个问题吗?例如,F 分布可以近似为两个卡方(例如http://en.wikipedia.org/wiki/F-distribution#Related_distributions_and_properties),并且在它的文档中qf
说明了有关使用qchisq
大 d2 的内容。实际上qchisq
在这些值上看起来确实是准确的,但对我来说如何实现这一点并不明显。例如
qf(0.05, 8, 100, lower.tail=FALSE)
和
(qchisq(0.05, 8, lower.tail=FALSE)/8) / (qchisq(0.05, 100, lower.tail=FALSE)/100)
不要给出相同的结果。
那么,问题是如何获得大 df2 的准确 F 值?任何帮助将不胜感激。谢谢!