问题标签 [chi-squared]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 对多行执行 Fisher 测试
我有一个名为“case.control”的数据有 1000 行和 2000 col 列是 case 或 control 所以我根据 case 和 control 将它们分开,所以我现在有两个数据集,一个是 1000 行和 400 col = case另一个 1000 行和 600 col = control 我试着在每一行做 Fisher 测试
此代码不起作用,因为有时我在单元格中的值为零,但代码将其更改为另一个数字,例如,如果我有
将其更改为
任何建议
数据看起来像这个样本:
r - R中的条件或无条件精确测试
我有一个 2x2 列联表,我想计算里面的对是否显着不同。我制作了一个如下所示的矩阵,名为 raw_matrix
创建这个矩阵,因此:
正如我所搜索的那样,像 Barnard's 和 Boschloo 的精确测试这样的无条件精确测试是为此目的最强大的测试。我安装了“Exact”包并尝试使用以下命令进行测试:
在 64GB 内存和 3.5 GH CPU 的计算机上花了半个多小时,最后它给出了以下错误:
然后我安装了“Exact2x2”包并使用以下命令进行了测试:
这给了我以下结果:
但正如我在“Exact”包教程中所读到的,作为条件精确测试的 Fisher 精确测试并不是那么强大。最后,我使用命令 chisq.test(raw.matrix) 进行了正常的卡方检验,得到的结果与 Fisher 检验的结果不同:
我是遗传学家,不是统计学专家,如果有人能告诉我这里做这个测试的最佳策略是什么,我很感激
r - 在 data.frame 上运行卡方检验
我有这个data.frame:
我想知道是否x
或与、或中y
的任何一个更相关。为了测试这一点,我可以使用卡方。V1
V2
V3
V4
这是我尝试过的,但都不起作用:
如何运行卡方检验df
?
python - 在scipy中找到卡方检验的自由度?
我有一个麦克斯韦分布观察结果,我符合预期的麦克斯韦分布。然后我进行卡方检验以找出拟合优度。但是我得到了很好的结果,我还想找出卡方检验使用的自由度。引用文档chisquare
:p 值是使用自由度为 k - 1 - ddof 的卡方分布计算的,其中 k 是观察到的频率数。ddof 的默认值为 0。
这里的 k 到底是什么?是我拥有的数据点总数(41000)吗?或者是每箱的频率?
.net - 如何使用 Math.net 计算拟合优度?
比如说,我有一个骰子,它产生 6 的可能性是 1 的 19 倍,因为它已被篡改。当我将这个骰子掷出 60 次时,六种可能结果的预期频率与观察频率分别为:
1:10、1
2:10、10
3:10、10
4:10、10
5:10、10
6:10:19
我想将这个预期观察到的对提供给算法,以确定骰子确实被篡改的可能性。
当我在这个网站上输入值对时,它计算出的卡方值为 16.2,P 值为 0.00629567,这表明观察到的结果不太可能与值 1 到 6 的预期分布一致。
我想使用math.net numerics计算 P 值,但是虽然我可以在那里找到一个ChiSquared 类,但我找不到如何将预期观察值对提供给它以获得 P 值。
怎么做到呢?
python - 使用 scikit-learn 进行特征选择
我是机器学习的新手。我正在准备使用 Scikit Learn SVM 进行分类的数据。为了选择最佳功能,我使用了以下方法:
由于我的数据集包含负值,因此出现以下错误:
有人可以告诉我如何转换我的数据吗?
r - 在 R 中创建 chisq.test() 时出错 - 参数的“类型”(字符)无效
我正在为data.frame
具有两个二进制变量和 13109 obs 的名为 Comp1 的独立性创建卡方检验。
在根据人口统计数据对消费者进行聚类之前,我正在使用该测试。如果这两个变量相互依赖,那么某些值将在一个簇中。这两个变量是另一个变量的子集,data.frame
有 36 个变量。
我得到一个错误,说data.frame
有character
变量而不是factors
函数str()
显示。
为什么错误说data.frame
有character
值?
数据:
例子:
解决方案错误:
r - R:N(0,1)变量的二次函数的奇怪pdf:错误编码或大舍入误差?
我想计算由以下定义的随机变量 y 的 pdf:
pdf 是非中心卡方分布。对于 a>0,如果 y 小于 d,则它应该等于 0,其中 d=c-(b^2)/4a。
奇怪的是,当用 R 计算它时,pdf 在 y>d+e 处上升,其中 e 非常大。
我的代码(如下)有错误还是舍入错误?在后一种情况下,如何解决?
图1:只是为了了解功能
PDF通过变量的方法更改
看看它是怎么弹起来的??
通过 CDF 获得 PDF
无论使用何种方法导出 pdf,结果都是相同的
r - 为什么 chisq.test 的 2 个输出在 R 中不同
下面,当数据实际上相同时,为什么 2 chisq.test 的输出不同:
第一种方法:
第二种方法:
编辑:回复评论:以下看起来相同:
数据:
r - 在 R 调查函数 svychisq() 中使用动态变量规范时出错
我正在使用 R 库中的函数survey
,并且根据Stackoverflow 上的这个示例,我使用bquote()
andas.name()
动态构造用于指定变量的公式。
这适用于svytable()
,但不适用于svychisq()
。例如:
terms.default(formula) 中的错误:没有术语组件或属性
我可以使这个动态变量规范更健壮,以便svychisq()
选择正确的术语吗?