问题标签 [chi-squared]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Fisher 测试错误:LDSTP 太小
输入
输出
如何在不修改原始数据的情况下解决此问题?这种比较是否有任何非参数检验?
montecarlo - 对卡方检验应用 p 值的蒙特卡罗模拟的规则
如果不是正确的地方,我很抱歉,但我没有在其他地方找到答案。我想知道我是否理解蒙特卡罗模拟在 chisq.test() 中的使用。
我有一个定性变量,它有 128 个级别/类。我的样本量是 26(我无法对更多“个人”进行抽样)。所以很明显,我会有一些“个人”为0的级别。但事实是,在 127 个可能的类别中,我只代表了极少数的类别。据说(我不完全理解其原因)要应用卡方检验,每个级别至少应该有 5 个人,我想我必须使用模拟.p.value 选项(在 R 中)来使用蒙特卡罗模拟来估计分布并计算 p 值。如果没有蒙特卡罗模拟,R 给我一个 p 值 < 1e-16。使用蒙特卡洛模拟,它给了我一个 4e-5 的 p 值。
我尝试用 26 个 1 和 101 个 0 的向量计算 p 值,通过蒙特卡洛模拟,我得到一个 1 的 p 值。
是否可以这样说,即使我的样本量与可能的类别数量相比很小,观察到的分布也使得所有可能的类别不太可能以相同的概率(1/127)存在于现实中人口 ?
谢谢你的帮助
朱利安
sql - SQL Server 查询以查找 CHI-SQUARE 值(不工作)
我试图从我对示例数据的以下 SQL Server 查询中找到卡方检验:
我的表有这种样本数据:
问题是这个查询工作正常,但它给出了错误的输出,或者你可以说根本没有输出。它给我的输出是这样的:
我怎么能摆脱这个问题,因为我已经尽力了!提前感谢告诉我我做错了什么!
sql - 卡方检验的 SQL 查询
我试图在表中的以下数据集上找到 CHI-SQUARE TEST。我正在尝试我的这个查询来找到 CHI-SQUARE TEST:
样本数据为:
但它给我的卡方检验值输出错误,它给出的输出是:
我已经尽力了,并搜索了很多关于这个问题的信息。请帮我一个忙,请解决问题!提前致谢!
sql - CHI-SQUARE TEST 的 SQL 查询给出错误的结果
请帮助我,因为我一直在尝试使用 SQL SERVER 2008 R2 Developers Edition 找出 CHI-SQUARED 测试。问题是查询在以下一组示例数据上运行良好:
所以,我一直在尝试的查询是:
此查询生成的结果是错误的,结果是:
作为 sessionnumber 1 和 sessionnumber 2 的正确 Chi Square 测试应该等于 9.117,因为我的查询给了我错误的结果。(此卡方是前 2 个 sessionnumbers 行的示例但正确的值)。因此,自过去 3 天以来,我一直在努力寻找答案并努力工作。最后发现我的这个查询有问题,它给了我错误的结果。
请有人帮助我,我会对此有所帮助!(我也会在 2 天后就这个问题申请赏金)。提前谢谢请帮助我,因为我对 SQL 查询有一点了解,因为我对它很陌生,因为我只使用了大约 3 个月!所以我真的需要一些帮助!
python - 是否有与 R 的 qchisq 函数等效的 python?
Rqchisq
函数将 p 值和自由度数转换为相应的卡方值。有没有等效的 Python 库?
我在 SciPy 中环顾四周,没有找到任何东西。
r - 使用循环在 R 中进行卡方检验
我是 R 新手。我发现以下代码用于对一组变量进行单变量逻辑回归。我想做的是针对因变量对变量列表运行卡方检验,类似于下面的逻辑回归代码。我发现其中几个涉及创建变量的所有可能组合,但我无法让它工作。理想情况下,我希望变量 (X) 之一相同。
python - 计算用于卡方检验的先前机会数字
所以,我正在使用一个脚本来计算一个人在行中指定日期之前的日期出现在列表中的次数,并且在第 6 列中出现 1,并且还计算了一个人的次数(列7) 出现在行中指定日期之前的日期列表中(注意它们按时间顺序排序。)(使用基于零的列引用)
示例数据集
我正在使用的代码
这将返回:
最终我会想要对我生成的百分比数据执行卡方。但是,现在我想要实现的只是能够计算和求和唯一数据类(第 2 列)中任何一个人的分数机会,并将其作为新列附加到 csv 中。我不确定是否可以编辑我使用的代码以实现这一点作为一个多合一的代码。任何关于如何最好地做到这一点的建设性建议或意见将不胜感激。
我想要的输出如下:
bayesian - 基于卡方的垃圾邮件检测如何在 SpamAssassin 中工作
我正在尝试了解基于贝叶斯的垃圾邮件检测,但很难理解如何对其进行编码。为了理解它,我正在阅读 SpamAssassin 的代码,如下所示。 http://svn.apache.org/viewvc/spamassassin/trunk/lib/Mail/SpamAssassin/Bayes/CombineChi.pm?view=markup
但是,我无法理解 chi2q 的功能。
我试图谷歌或阅读书籍,但找不到完整的解释,包括从理论到代码。
你能解释一下它为什么起作用吗?
statistics - Proc Freq 中的错误
我有一个包含 2 个治疗组和一个载体组的多次访问数据集。我还有一个变量说“SSA”,它有两个值 1 和 0。这里 1 代表响应者,0 代表非响应者主题。在为卡方统计执行 Proc Freq 时,我收到以下错误。这是我使用的代码
注意:没有计算 TREATMENT * SSA 的统计数据,因为 SSA 的无缺失级别少于 2 个。警告:不会生成 OUTPUT 数据集,因为无法为该表计算统计信息,该表的行或列变量少于 2 个且无缺失级别。这个错误是针对我上次访问的,我在所有治疗组和车辆中都有一个值 0。