问题标签 [chi-squared]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
4313 浏览

r - 几何分布的卡方拟合优度

作为一项任务,我必须使用 PMF 为给定的几何分布开发和算法并生成样本

在此处输入图像描述

使用逆变换方法,我想出了以下用于生成值的表达式:

在此处输入图像描述

其中 U 代表一个值或 n 个值,具体取决于样本的大小,取自 Unif(0,1) 分布,p 为 0.3,如上述 PMF 所述。

我有算法,R 中的实现,我已经生成了 QQ 图,以直观地评估经验值对理论值的调整(用 R 生成),即,如果生成的样本确实遵循几何分布。

现在我想将生成的样本提交给拟合优度测试,即卡方,但我在 R 中遇到了麻烦。

0 投票
0 回答
299 浏览

matlab - 不同长度的卡方向量

我有 3 个数据向量代表 3 个组 A、B、C 的性别(0=男性,1=女性)。

例如

以及男女相对人数

我想知道这三组之间的性别是否存在显着差异。为此,我读到可以使用

如何将其与超过 2 组数据和具有不同长度的数据一起使用?有没有其他方法可以在适合我的情况的matlab中执行卡方检验?提前致谢

0 投票
1 回答
1691 浏览

matlab - MATLAB中的chi2test——不同长度的向量

我有 3 个数据向量代表 3 个组 A、B、C 的性别(0=男性,1=女性)。

例如

以及男女相对人数

我想知道这三组之间的性别是否存在显着差异。为此,我读到可以使用

如何将其与超过 2 组数据和具有不同长度的数据一起使用?有没有其他方法可以在 MATLAB 中执行适合我的情况的卡方检验?

提前致谢

0 投票
1 回答
544 浏览

r - 在 R 中模拟样本,存储它们并计算测试统计量

我使用蒙特卡罗算法通过反演采样生成几何分布大小为 100 的数据样本:

上面的函数是几何分布的 CDF 的倒数

我不知道该怎么做是随机模拟 1000 个大小为 100 的数据样本并计算每个样本的卡方检验统计量。我创建示例的尝试如下:

}

但是,这给了我控制台的所有示例,以后无法引用它们。

我真的很感激一些帮助。

谢谢

0 投票
1 回答
3327 浏览

python - Python scipy chisquare 返回与 R chisquare 不同的值

我正在尝试使用scipy.stats.chisquare. 我建立了一个玩具示例:

返回中的相同示例R

我究竟做错了什么?

谢谢

0 投票
1 回答
1766 浏览

r - R:chisq.test 在 99%

有没有办法将 chi sq 测试置信度从 95% 设置为 99%?

基本功能

chisq.test()

不要抱怨这个功能......

编辑:

我不要求 p 值。我的问题是关于信心风险。

chisq 测试的 alpha 风险(置信度)默认为 0.05。我想将其设置为 0.01(99% 置信度)。阿尔法风险是统计量 X 的截止值。对于给定的具有“x”自由度的 Chi 分布,阿尔法风险对应于“X 风险统计量”。如果“我们数据的 X 统计量”大于“X 风险统计量”,我们拒绝 H0。我们可以计算 p 值,这可以解释为我们的 H1 为真的概率。

我会将置信风险从 0.05 更改为 0.01。如果我们改变置信风险,p 值就会改变。例如,对于 95% 的置信度,p 值为 0.001,对于 99% 的置信度可能是 0.2。

0 投票
1 回答
1633 浏览

r - R中费舍尔精确检验的值

R用来计算列联表上的 Fisher Exact 检验。我需要它,因为在某些表格单元格中,我的值低于 5,所以我不能使用Chi-square.

我使用 fisher.test(table),但这只会给我一个 p 值。


问题:如果我还需要检验统计量的值怎么办?

0 投票
2 回答
1292 浏览

sift - 实现卡方来查找 2 个 SIFT 特征之间的距离

我正在尝试实现卡方算法是:

我的问题是卡方中的除法器可能为 0,它会使距离变为 NaN。我应该将分隔线设为 1 还是忽略它?或者还有另一种计算 SIFT 特征的卡方算法?

0 投票
1 回答
5630 浏览

r - R中的两样本卡方检验

我对R真的很陌生,所以请多多包涵。我正在使用卡方检验来比较给定位置的核苷酸频率,并计算了两个不同数据集中的 A、C、G、T 的数量:

我可以想到两种方法来进行两样本卡方检验:

或者

我怀疑第二个版本是正确的,因为我也可以这样做:

具有相同且明显不正确的结果。

在这种情况下实际计算的是什么?

谢谢!

0 投票
1 回答
1630 浏览

python - 熊猫:行和列总和的外积

在 Pandas 中,我正在尝试手动编写卡方检验。我在下面的数据框中进行row 0比较。row 1

为此,我需要将每个单元格的预期单元格计数计算为cell(i,j) = rowSum(i)*colSum(j) / sumAll:在 R 中,我可以简单地通过获取outer()产品来做到这一点:

我使用 numpy 的外积函数来模仿上述 R 代码的结果:

是否可以使用 Pandas 功能实现这一点?