问题标签 [chi-squared]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 计算具有 NA 值的卡方
我想在缺少数据的两个值之间执行卡方检验。我怎样才能做到这一点?我已经在不同的来源中多次查找过这个,但都没有成功。
matlab - matlab计算拟合优度
我有一组观察结果obs
。
如果我绘制观察的直方图,我发现它们可能来自伽马分布
我想用卡方拟合优度来证明它。
所以我首先估计伽玛参数
并使用 chi2gof 查看假设是否为真(h = 0)。
我的问题是我得到 ap = NaN ...这怎么可能?我的错误在哪里?谢谢
要对其进行测试,请下载 obs.mat 文件 https://drive.google.com/file/d/0B3vXKJ_zYaCJbHU2SHhac29MRms/view?usp=sharing
machine-learning - 卡方和 zscore - 选择哪一个?
我在stat stack exchange上发布了问题,但不幸的是到目前为止没有答案,所以我在这里克隆它,希望有人能提供帮助。
我是机器学习的新手。最近我试图在这方面学习一些东西并得到以下关注:
我有按类别分类的产品。我也有具有性别和设备型号信息的用户。
首先,我做了一个卡方检验来检查类别和性别+设备信息是否相关联。例如,我的 p 值为 0.000012,所以我声明用户(性别 + 设备)与类别相关联。
所以如果一个新用户带着他的性别(女性)+设备(iPhone):
作为卡方检验结果,性别+设备和类别之间应该存在关联。因此,我选择了使用 iPhone 的女性消费的前 10 个类别。我有清单,例如 [1. 时尚,2. 移动设备 3. 相机,4. 家居家具,5. 自行车等]
我还对类别进行了 z 测试(没有任何用户信息),并获得了列表(较高的 z 分数将位于顶部),例如 [1. 移动设备,2.自行车,3.时尚,4.笔记本电脑等]
那么在这种情况下,我应该向该用户提供哪个列表?或者有没有可能将它们结合起来?还是我做错了什么?
提前致谢 :-)
r - R函数等于excel CHIINV
我正在寻找一个与 excel 的 CHIINV 做同样事情的函数。从 Microsoft 文档中,CHIINV 的定义是返回卡方分布的右尾概率的倒数
例如
=CHIINV(0.2,2)
返回 3.21
我在 R 中找到的最接近的函数是 geoR 的 dinvchisq 但是,
dinvchisq(0.2,2)
返回 1.026062
请帮忙!
r - R中的卡方检验(将真实数据与理论正态分布进行比较)
我想做一个卡方检验,将我的数据(“真实”列)与理论正态分布(“理论”列)进行比较,理论正态分布(在 Excel 中)通过大真实样本的参数(处理这个样本的排名 - 是“真实”列)。
RI 中的什么测试应该用于此目的?
一开始我以为应该是chisq.test
但是我将它的结果与 EXCEL 中函数“CHI2TEST”的结果进行比较(应该给出相同的结果),这些结果是完全不同的。它给出 p 值 = 0.2426,Excel 的 CHI2TEST 给出 p 值 0.87。
也许我用chisq.test
错了?您能否检查我的脚本或建议我正确测试 R 中的卡方检验?
c++ - 通过提升将概率映射到阈值
我需要计算某个阈值 t 的漏检概率,其中卡方分布具有非中心性参数 lambda。
我试图理解提升概率的乐趣,但到目前为止我还没有想出一些有用的东西。
给出选择低于或高于 t 的概率。
如何将给定概率反向映射p
到阈值t
?
r - chi-square distribution R
Trying to fit a chi_square distribution using fitdistr()
in R. Documentation on this is here (and not very useful to me): https://stat.ethz.ch/R-manual/R-devel/library/MASS/html/fitdistr.html
Question 1: chi_df
below has the following output: 3.85546875 (0.07695236)
. What is the second number? The Variance or standard deviation?
Question 2: fitdistr
generates 'k' defined by the Chi-SQ distribution. How do I fit the data so I get the scaling constant 'A'? I am dumbly using lines 14-17 below. Obviously not good.
Question 3: Is the Chi-SQ distribution only defined for a certain x-range? (Variance is defined as 2K, while mean = k. This must require some constrained x-range... Stats question not programming...)
Thanks for your help!
chi-squared - 卡方2序变量如何总结R中的类别?
我对统计完全陌生,只是在努力测试我最近收集的一些数据。
下图向您展示了我拥有的那种材料。对于第一个测试,我只想对两个序数变量(satisfied_scale 和 time_scale)运行卡方。两者都有 1(完全同意)到 5(完全不同意),但由于我没有太多数据,我需要将它们总结为三组(1+2、3、4+5),仅此而已我不知道如何在 R 中做到这一点。问这个有点尴尬,但我已经花了两个小时寻找那个,不想浪费更多时间。
我将这两个向量转换为因子并添加了一些标签。
现在,当我把它们放在一张桌子上时,我得到了这个(对你们来说可能很明显;-):
当我像这样运行卡方检验时:
我明白了:
那么,我该如何总结这些类别以获得更好的结果呢?
编辑:第一行实际上应该包含适当的问候语,但不知何故,无论我多久编辑一次,它总是被切断。
r - R:拟合大 x 范围的卡方分布
很容易在有限范围内很好地拟合卡方分布:
但是,假设我有一个数据集,其中分布分布在 X 轴上,其新值由以下内容给出:
chii <- 5*rchisq(nnn,4, ncp = 0)
在不知道 5
真实数据集的乘法因子的情况下,我如何规范化 rchisq()
/ 复杂数据以很好地拟合 fitdistr()
?
在此先感谢您的帮助!
r - 有人能告诉我为什么 R 没有为这个 chisq.test 使用整个 data.frame 吗?
data.frame
在尝试创建自己的问题并对其进行定量分析(例如 a )时,我无法想出解决方案chisq.test
。
背景如下:我总结了我收到的关于两家医院的数据。两者都测量了相同的分类变量 n 次。在这种情况下,它是在特定观察期内发现与医疗保健相关的细菌的频率。
在表格中,汇总数据如下所示,其中 % 表示在该时间段内进行的所有测量的百分比。
现在看看百分比,很明显这些比例非常相似,你可能想知道我到底为什么要对两家医院进行统计比较。但我有其他数据,比例不同,所以这个问题的目的是:
如何根据测量的类别比较医院 1 和医院 2。
由于数据以汇总方式和数组格式提供,因此我决定data.frame
为每个单个变量/类别制作一个。
到目前为止一切都很好,因为摘要似乎现在能够运行chisq.test()
. 但是现在,事情变得很奇怪。
结果,似乎表明存在显着差异。如果您对数据进行交叉制表,您会看到 R 以一种非常奇怪的方式对其进行汇总:
因此,当然,如果以这种方式汇总数据,将会有一个具有统计学意义的发现——因为一个类别被总结为根本没有测量值。为什么会发生这种情况,我能做些什么来纠正它?最后,不必data.frame
为每个类别单独制作一个,是否有明显的循环功能?我想不出一个。
谢谢你的帮助!
根据 THELATEMAIL 对 RAW DATA.FRAME 的请求进行了更新
说明:这data.frame
实际上比上表中总结的要复杂,因为它还包含培养的特定类型细菌的位置(即伤口、血培养、导管等)。所以我正在制作的表格实际上如下所示:
如果标题为“所有位置”,随后将被伤口、血液、尿液、导管等取代。