我有一个麦克斯韦分布观察结果,我符合预期的麦克斯韦分布。然后我进行卡方检验以找出拟合优度。但是我得到了很好的结果,我还想找出卡方检验使用的自由度。引用文档chisquare
:p 值是使用自由度为 k - 1 - ddof 的卡方分布计算的,其中 k 是观察到的频率数。ddof 的默认值为 0。
这里的 k 到底是什么?是我拥有的数据点总数(41000)吗?或者是每箱的频率?
我有一个麦克斯韦分布观察结果,我符合预期的麦克斯韦分布。然后我进行卡方检验以找出拟合优度。但是我得到了很好的结果,我还想找出卡方检验使用的自由度。引用文档chisquare
:p 值是使用自由度为 k - 1 - ddof 的卡方分布计算的,其中 k 是观察到的频率数。ddof 的默认值为 0。
这里的 k 到底是什么?是我拥有的数据点总数(41000)吗?或者是每箱的频率?
k
是 的大小f_obs
,是 的第一个参数chisquare
。它是垃圾箱的数量。
例如,在以下来自 docstring 的示例中,
>>> chisquare([16, 18, 16, 14, 12, 12])
(2.0, 0.84914503608460956)
f_obs
是[16, 18, 16, 14, 12, 12]
,k
是len(f_obs)
, 或 6。
文档遵循典型的统计变量名称。K-1 是自由度。K 表示每个大小为 n 的样本数量。所以用你的话来说,每箱的频率。
http://statistics.about.com/od/Inferential-Statistics/a/What-Is-A-Degree-Of-Freedom.htm的最后一段内容如下:
另一个计算自由度的不同方法的例子是 F 检验。在进行 F 检验时,我们有 k 个样本,每个样本大小为 n。分子中的自由度为 k - 1,分母中的自由度为 k(n - 1)。