“chi-squared”的相关标签问题

0 投票

1 回答

8773 浏览

r - 计算具有 NA 值的卡方

我想在缺少数据的两个值之间执行卡方检验。我怎样才能做到这一点？我已经在不同的来源中多次查找过这个，但都没有成功。

r statistics na chi-squared

user2105555

2014-11-15T00:29:50.403

0 投票

0 回答

1117 浏览

matlab - matlab计算拟合优度

我有一组观察结果obs。

如果我绘制观察的直方图，我发现它们可能来自伽马分布

我想用卡方拟合优度来证明它。

所以我首先估计伽玛参数

并使用 chi2gof 查看假设是否为真（h = 0）。

我的问题是我得到 ap = NaN ...这怎么可能？我的错误在哪里？谢谢

要对其进行测试，请下载 obs.mat 文件 https://drive.google.com/file/d/0B3vXKJ_zYaCJbHU2SHhac29MRms/view?usp=sharing

matlab distribution chi-squared

2014-11-16T21:49:51.757

0 投票

1 回答

1178 浏览

machine-learning - 卡方和 zscore - 选择哪一个？

我在stat stack exchange上发布了问题，但不幸的是到目前为止没有答案，所以我在这里克隆它，希望有人能提供帮助。

我是机器学习的新手。最近我试图在这方面学习一些东西并得到以下关注：

我有按类别分类的产品。我也有具有性别和设备型号信息的用户。

首先，我做了一个卡方检验来检查类别和性别+设备信息是否相关联。例如，我的 p 值为 0.000012，所以我声明用户（性别 + 设备）与类别相关联。

所以如果一个新用户带着他的性别（女性）+设备（iPhone）：

作为卡方检验结果，性别+设备和类别之间应该存在关联。因此，我选择了使用 iPhone 的女性消费的前 10 个类别。我有清单，例如 [1. 时尚，2. 移动设备 3. 相机，4. 家居家具，5. 自行车等]
我还对类别进行了 z 测试（没有任何用户信息），并获得了列表（较高的 z 分数将位于顶部），例如 [1. 移动设备，2.自行车，3.时尚，4.笔记本电脑等]

那么在这种情况下，我应该向该用户提供哪个列表？或者有没有可能将它们结合起来？还是我做错了什么？

提前致谢：-）

machine-learning classification recommendation-engine chi-squared

2014-11-25T05:40:49.120

0 投票

1 回答

1586 浏览

r - R函数等于excel CHIINV

我正在寻找一个与 excel 的 CHIINV 做同样事情的函数。从 Microsoft 文档中，CHIINV 的定义是返回卡方分布的右尾概率的倒数

例如 =CHIINV(0.2,2)返回 3.21

我在 R 中找到的最接近的函数是 geoR 的 dinvchisq 但是，

dinvchisq(0.2,2)返回 1.026062

请帮忙！

r chi-squared excel

Decula

2014-12-18T03:12:28.657

0 投票

1 回答

4319 浏览

r - R中的卡方检验（将真实数据与理论正态分布进行比较）

我想做一个卡方检验，将我的数据（“真实”列）与理论正态分布（“理论”列）进行比较，理论正态分布（在 Excel 中）通过大真实样本的参数（处理这个样本的排名 - 是“真实”列）。

RI 中的什么测试应该用于此目的？

一开始我以为应该是chisq.test

但是我将它的结果与 EXCEL 中函数“CHI2TEST”的结果进行比较（应该给出相同的结果），这些结果是完全不同的。它给出 p 值 = 0.2426，Excel 的 CHI2TEST 给出 p 值 0.87。

也许我用chisq.test错了？您能否检查我的脚本或建议我正确测试 R 中的卡方检验？

r chi-squared

2014-12-18T20:47:53.297

0 投票

1 回答

109 浏览

c++ - 通过提升将概率映射到阈值

我需要计算某个阈值 t 的漏检概率，其中卡方分布具有非中心性参数 lambda。

我试图理解提升概率的乐趣，但到目前为止我还没有想出一些有用的东西。

给出选择低于或高于 t 的概率。

如何将给定概率反向映射p到阈值t？

c++boost chi-squared probability-density

2015-01-11T13:10:17.950

0 投票

1 回答

6325 浏览

r - chi-square distribution R

Trying to fit a chi_square distribution using fitdistr() in R. Documentation on this is here (and not very useful to me): https://stat.ethz.ch/R-manual/R-devel/library/MASS/html/fitdistr.html

Question 1: chi_df below has the following output: 3.85546875 (0.07695236). What is the second number? The Variance or standard deviation?

Question 2: fitdistr generates 'k' defined by the Chi-SQ distribution. How do I fit the data so I get the scaling constant 'A'? I am dumbly using lines 14-17 below. Obviously not good.

Question 3: Is the Chi-SQ distribution only defined for a certain x-range? (Variance is defined as 2K, while mean = k. This must require some constrained x-range... Stats question not programming...)

Thanks for your help!

r distribution data-fitting chi-squared

2015-03-03T20:59:32.587

0 投票

0 回答

65 浏览

chi-squared - 卡方2序变量如何总结R中的类别？

我对统计完全陌生，只是在努力测试我最近收集的一些数据。

下图向您展示了我拥有的那种材料。对于第一个测试，我只想对两个序数变量（satisfied_scale 和 time_scale）运行卡方。两者都有 1（完全同意）到 5（完全不同意），但由于我没有太多数据，我需要将它们总结为三组（1+2、3、4+5），仅此而已我不知道如何在 R 中做到这一点。问这个有点尴尬，但我已经花了两个小时寻找那个，不想浪费更多时间。

我将这两个向量转换为因子并添加了一些标签。

现在，当我把它们放在一张桌子上时，我得到了这个（对你们来说可能很明显;-)：

当我像这样运行卡方检验时：

我明白了：

那么，我该如何总结这些类别以获得更好的结果呢？

编辑：第一行实际上应该包含适当的问候语，但不知何故，无论我多久编辑一次，它总是被切断。

data_material_last2ColumnsOfInterest

chi-squared ordinal

user3142830

2015-03-07T15:14:40.780

0 投票

1 回答

1540 浏览

r - R：拟合大 x 范围的卡方分布

很容易在有限范围内很好地拟合卡方分布：

但是，假设我有一个数据集，其中分布分布在 X 轴上，其新值由以下内容给出：
chii <- 5*rchisq(nnn,4, ncp = 0)

在不知道 5 真实数据集的乘法因子的情况下，我如何规范化 rchisq()/ 复杂数据以很好地拟合 fitdistr()？

在此先感谢您的帮助！

r distribution curve-fitting chi-squared

2015-03-08T03:31:13.173

0 投票

1 回答

208 浏览

r - 有人能告诉我为什么 R 没有为这个 chisq.test 使用整个 data.frame 吗？

data.frame在尝试创建自己的问题并对其进行定量分析（例如 a ）时，我无法想出解决方案chisq.test。

背景如下：我总结了我收到的关于两家医院的数据。两者都测量了相同的分类变量 n 次。在这种情况下，它是在特定观察期内发现与医疗保健相关的细菌的频率。

在表格中，汇总数据如下所示，其中 % 表示在该时间段内进行的所有测量的百分比。

现在看看百分比，很明显这些比例非常相似，你可能想知道我到底为什么要对两家医院进行统计比较。但我有其他数据，比例不同，所以这个问题的目的是：

如何根据测量的类别比较医院 1 和医院 2。

由于数据以汇总方式和数组格式提供，因此我决定data.frame为每个单个变量/类别制作一个。

到目前为止一切都很好，因为摘要似乎现在能够运行chisq.test(). 但是现在，事情变得很奇怪。

结果，似乎表明存在显着差异。如果您对数据进行交叉制表，您会看到 R 以一种非常奇怪的方式对其进行汇总：

因此，当然，如果以这种方式汇总数据，将会有一个具有统计学意义的发现——因为一个类别被总结为根本没有测量值。为什么会发生这种情况，我能做些什么来纠正它？最后，不必data.frame为每个类别单独制作一个，是否有明显的循环功能？我想不出一个。

谢谢你的帮助！

根据 THELATEMAIL 对 RAW DATA.FRAME 的请求进行了更新

说明：这data.frame实际上比上表中总结的要复杂，因为它还包含培养的特定类型细菌的位置（即伤口、血培养、导管等）。所以我正在制作的表格实际上如下所示：

如果标题为“所有位置”，随后将被伤口、血液、尿液、导管等取代。

r function chi-squared

2015-03-11T06:05:40.280

问题标签 [chi-squared]

Reference