问题标签 [chi-squared]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
772 浏览

r - 对多行执行 Fisher 测试

我有一个名为“case.control”的数据有 1000 行和 2000 col 列是 case 或 control 所以我根据 case 和 control 将它们分开,所以我现在有两个数据集,一个是 1000 行和 400 col = case另一个 1000 行和 600 col = control 我试着在每一行做 Fisher 测试

此代码不起作用,因为有时我在单元格中的值为零,但代码将其更改为另一个数字,例如,如果我有

将其更改为

任何建议

数据看起来像这个样本:

0 投票
1 回答
394 浏览

r - R中的条件或无条件精确测试

我有一个 2x2 列联表,我想计算里面的对是否显着不同。我制作了一个如下所示的矩阵,名为 raw_matrix

创建这个矩阵,因此:

正如我所搜索的那样,像 Barnard's 和 Boschloo 的精确测试这样的无条件精确测试是为此目的最强大的测试。我安装了“Exact”包并尝试使用以下命令进行测试:

在 64GB 内存和 3.5 GH CPU 的计算机上花了半个多小时,最后它给出了以下错误:

然后我安装了“Exact2x2”包并使用以下命令进行了测试:

这给了我以下结果:

但正如我在“Exact”包教程中所读到的,作为条件精确测试的 Fisher 精确测试并不是那么强大。最后,我使用命令 chisq.test(raw.matrix) 进行了正常的卡方检验,得到的结果与 Fisher 检验的结果不同:

我是遗传学家,不是统计学专家,如果有人能告诉我这里做这个测试的最佳策略是什么,我很感激

0 投票
2 回答
9709 浏览

r - 在 data.frame 上运行卡方检验

我有这个data.frame:

我想知道是否x或与、或中y的任何一个更相关。为了测试这一点,我可以使用卡方。V1V2V3V4

这是我尝试过的,但都不起作用:

如何运行卡方检验df

0 投票
2 回答
2316 浏览

python - 在scipy中找到卡方检验的自由度?

我有一个麦克斯韦分布观察结果,我符合预期的麦克斯韦分布。然后我进行卡方检验以找出拟合优度。但是我得到了很好的结果,我还想找出卡方检验使用的自由度。引用文档chisquare

:p 值是使用自由度为 k - 1 - ddof 的卡方分布计算的,其中 k 是观察到的频率数。ddof 的默认值为 0。

这里的 k 到底是什么?是我拥有的数据点总数(41000)吗?或者是每箱的频率?在此处输入图像描述

0 投票
2 回答
2188 浏览

.net - 如何使用 Math.net 计算拟合优度?

比如说,我有一个骰子,它产生 6 的可能性是 1 的 19 倍,因为它已被篡改。当我将这个骰子掷出 60 次时,六种可能结果的预期频率与观察频率分别为:

1:10、1
2:10、10
3:10、10
4:10、10
5:10、10
6:10:19

我想将这个预期观察到的对提供给算法,以确定骰子确实被篡改的可能性。

当我在这个网站上输入值对时,它计算出的卡方值为 16.2,P 值为 0.00629567,这表明观察到的结果不太可能与值 1 到 6 的预期分布一致。

我想使用math.net numerics计算 P 值,但是虽然我可以在那里找到一个ChiSquared 类,但我找不到如何将预期观察值对提供给它以获得 P 值。

怎么做到呢?

0 投票
1 回答
41218 浏览

python - 使用 scikit-learn 进行特征选择

我是机器学习的新手。我正在准备使用 Scikit Learn SVM 进行分类的数据。为了选择最佳功能,我使用了以下方法:

由于我的数据集包含负值,因此出现以下错误:

有人可以告诉我如何转换我的数据吗?

0 投票
1 回答
8288 浏览

r - 在 R 中创建 chisq.test() 时出错 - 参数的“类型”(字符)无效

我正在为data.frame具有两个二进制变量和 13109 obs 的名为 Comp1 的独立性创建卡方检验。

在根据人口统计数据对消费者进行聚类之前,我正在使用该测试。如果这两个变量相互依赖,那么某些值将在一个簇中。这两个变量是另一个变量的子集,data.frame有 36 个变量。

我得到一个错误,说data.framecharacter变量而不是factors函数str()显示。

为什么错误说data.framecharacter值?

数据:

例子:

解决方案错误:

0 投票
1 回答
84 浏览

r - R:N(0,1)变量的二次函数的奇怪pdf:错误编码或大舍入误差?

我想计算由以下定义的随机变量 y 的 pdf:

pdf 是非中心卡方分布。对于 a>0,如果 y 小于 d,则它应该等于 0,其中 d=c-(b^2)/4a。

奇怪的是,当用 R 计算它时,pdf 在 y>d+e 处上升,其中 e 非常大。

我的代码(如下)有错误还是舍入错误?在后一种情况下,如何解决?

图1:只是为了了解功能

PDF通过变量的方法更改

看看它是怎么弹起来的??

通过 CDF 获得 PDF

无论使用何种方法导出 pdf,结果都是相同的

0 投票
2 回答
625 浏览

r - 为什么 chisq.test 的 2 个输出在 R 中不同

下面,当数据实际上相同时,为什么 2 chisq.test 的输出不同:

第一种方法:

第二种方法:

编辑:回复评论:以下看起来相同:

数据:

0 投票
1 回答
334 浏览

r - 在 R 调查函数 svychisq() 中使用动态变量规范时出错

我正在使用 R 库中的函数survey,并且根据Stackoverflow 上的这个示例,我使用bquote()andas.name()动态构造用于指定变量的公式。

这适用于svytable(),但不适用于svychisq()。例如:

terms.default(formula) 中的错误:没有术语组件或属性

我可以使这个动态变量规范更健壮,以便svychisq()选择正确的术语吗?