问题标签 [chi-squared]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
5418 浏览

r - R中幂律分布的拟合优度检验

我有一个使用 igraph 软件适合幂律的网络:

plf 变量现在包含以下变量:

igraph 手册解释了这些变量:

我想对此幂律拟合进行“拟合优度”测试。但我不知道该怎么做,虽然我发现这个问题已经在在线论坛上提出过,但通常仍然没有答案。

我认为一种方法是做一个 chisq.test(x,y)。一个输入参数(比如 x)是 degree_dist 变量(观察到的网络度数分布)。另一个输入参数(比如 y)是拟合的幂律方程,它的形式应该是 P(k) = mk^a。

我不确定这是否是一种合理的方法,如果是,我需要有关如何构建拟合幂律方程的建议。

如果有帮助,我的网络的 degree_dist 是:

(这些是网络中 0-21 度发生的频率。(例如,73% 的节点具有 1 度,1% 的节点具有 21 度)。

** * ** * *** 编辑** * ** * ** * ****

我不确定上面使用 degree_dist 计算 plf 是否是错误的。如果是这样,我还使用网络中 100 个节点的度数运行相同的函数:

其中,pure_deg 是:

这导致输出:

0 投票
2 回答
2592 浏览

machine-learning - 使用卡方检验进行特征选择

我总是难以理解卡方检验的重要性以及如何将其用于特征选择。我尝试阅读 wiki 页面,但没有得到实际的理解。谁能解释一下?

0 投票
1 回答
2074 浏览

r - 没有 Yates 校正的卡方拟合优度

我想进行理论上的卡方拟合优度测试:

样本量 n=100,alpha=0.05,df=1。这给出了 3.84 的临界 chi 值。我可以手动计算测试统计为 ((20-10)^2)/10 + ((80-90)^2)/90 = 100/9 > 3.84

但是,上面的代码只是产生

我的错误在哪里?

0 投票
0 回答
186 浏览

python - Python scipy.optimize 通过 x 偏差拟合

我在 Python 中有一个简单的拟合问题——我有一些数据和一个拟合函数,我想要的只是找到最佳参数。

问题是,我的 x 数据是我的因变量,我的 y 数据是我的自变量。所以我希望 Python 找到参数以最小化关于 x 偏差的卡方,而不是默认的 y 偏差。

显而易见的解决方案是反转我的拟合函数并交换我的 x 和 y 参数,但由于函数的性质,这是不可能的:

y = a / (exp((vx)/c) + 1) + d(即费米-狄拉克步长),如果没有奇点/未定义,则无法反转。

如果有人可以帮助我扭转卡方评估的性质,那将是惊人的!(最好不要只是从头开始编写一个新的优化例程......)

小号

0 投票
1 回答
2024 浏览

r - 找到具有 NA 值的卡方

我有两个向量,它们都有NA值。我正在尝试为使用两个向量创建的表查找卡方值,但出现此错误:

chisq.test(data.table) 中的错误:
“x”的所有条目必须是非负的和有限的

是否有从表中删除 NA 值的代码?

我确实找到了一些代码来为向量执行此操作,但我不确定这将如何工作。如果从一个向量中删除了一个 NA 值,那么来自另一个向量的相应值是否不会进入卡方计算?

每个向量都有超过 8,000 个值,每一行对应一个主题,因此如果该主题未能回答问题,我也不想使用他/她的其他答案。我希望这是有道理的。

0 投票
0 回答
592 浏览

matlab - 使用金字塔匹配核距离的直方图比较

我正在关注图像(草图和照片)的空间金字塔表示,即将图像划分为多个2L级别,每个级别l = 0, 1, ..., L-1都有22l网格。

这意味着level 01网格(单个图像),level 14网格等等。

我考虑过4 levels这里。我将图像划分为4 levelsie 64 blocks。然后在每一层划分的图像有多少个直方图(例如level 14 blocks等等4 histograms)然后通过合并这些直方图得到最终的直方图(保持这个例子最终的直方图是通过合并4个直方图等等获得的)。

然后这个草图图像的最终直方图与每个级别的照片图像的最终直方图进行匹配。

我想比较两个图像的直方图,即草图图像直方图(来自用户的输入)和照片图像(彩色图像的数据库,虽然我还没有创建数据库但我需要创建。也请帮助我)使用金字塔匹配内核 (PMK) 距离。这个距离如下: 我想要实现这个距离的源代码。

在哪里:

  • L - 级别数 = 4(我正在考虑)
  • l - 个人级别,即0、1、2、3(因为我考虑的是4个级别)
  • Hs - 草图直方图
  • Hp - 照片直方图

目前我正在静态计算这些直方图,但我需要在.matmatlab 的数据库中存储一张照片图像的四个直方图(四个直方图,因为第一级是第一级,第二级是第二级,第三级是第三级,第四级是第四级),所以我可以运行循环以将输入图像直方图与数据库中图像的直方图进行比较。

我需要你的帮助来实现这个 PMK 距离和创建数据库来存储单个照片图像的 4 个直方图。目前我有 100 张图像,所以我需要将与每张照片图像对应的直方图存储在.mat文件中,告诉我该怎么做?

0 投票
1 回答
13859 浏览

python - Python - 最小化卡方

我一直在尝试通过最小化卡方来将线性模型拟合到一组应力/应变数据。不幸的是,使用下面的代码不能正确地最小化chisqfunc函数。它在初始条件下找到最小值x0,这是不正确的。我查看了scipy.optimize文档并测试了最小化其他正常工作的功能。您能否建议如何修复下面的代码或建议另一种方法,我可以通过最小化卡方来将线性模型拟合到数据?

感谢您阅读我的问题,任何帮助将不胜感激。

干杯,威尔

编辑:我目前使用的数据集:链接到数据

0 投票
2 回答
2550 浏览

r - 跨类别和列自动化卡方

我有一个调查数据框,其中包含几个问题(列),编码为 1=agree/0=disagree。受访者(行)根据“年龄”(“年轻”、“中”、“老”)、“地区”(“东部”、“中”、“西部”)等指标进行分类。大约有 30 个类别共(3个年龄、3个地区、2个性别、11个职业等)。在每个指标中,类别不重叠且大小不同。

这模拟了数据集的缩减版本:

对于 Q15a,我可以使用卡方来测试西方的响应是否与总样本显着不同,其中:

我想根据 Q15a 的总样本测试所有类别,然后再测试大约 20 个其他问题。由于每个问题大约有 30 个测试,我想找到一种方法(有效或其他方式)来自动执行此操作,但我正在努力了解如何让 R 自己执行此操作或如何编写循环来循环遍历类别。我已经搜索了[1],并使用pairwise.prop.test() 进行了成对比较测试,但还没有找到任何真正回答这个问题的东西。

[1] 类似但不重复的问题(都是按列测试):

使用循环在 R 中进行卡方检验

在 R 中使用 for 循环进行卡方分析

0 投票
1 回答
150 浏览

spss - SPSS如何将卡方检验的值作为变量?

我有两张桌子和通过

您不仅会收到 2 个包含结果的表格,还会收到卡方检验的表格。

但这对我来说信息太多了。我只需要一个文本输出:

通过某事。喜欢

现在的问题是:如何获得变量“chisq-value”?通过 /stat..=chisq 我没有收到一个可以从 16.92 中减去的值(即我的计算值,它必须大于 chi 值),而是整个表......

谢谢你的帮助 :-)

0 投票
1 回答
398 浏览

r - R中[0,num_max]范围内给定一组随机数的卡方检验和KS检验?

我制作了一个随机数生成器并生成了 0 到 10007 范围内的 N 个数字,我想测试这个生成器在 R 中有多好。