问题标签 [hypothesis-test]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
2914 浏览

r - R中的配对t检验

我正在尝试在 R 中对按因素分组的数据进行配对 t 检验:

我首先尝试使用:

但我得到了错误

complete.cases(x, y) 中的错误:并非所有参数都具有相同的长度

这对我来说没有多大意义。

我考虑过使用ddply()apply()summaryBy(),但无法让它工作,因为配对 t 检验的输入需要 2 个向量,而我提到的大多数前面的函数似乎在只有一列被“操作”时效果最好。

为了解决这个问题,我尝试使用 for 循环来达到相同的目的:

但是,当我这样做时,我得到了错误

成对 || !is.null(y) : x||y 中的“x”类型无效

所以我检查了typeof(pair_sub$Ins)。原来那个类型是双精度的,它是数字的,所以我不确定为什么配对 t 检验不起作用。关于如何解决这两种方法的任何想法?

0 投票
1 回答
633 浏览

python - 为 statsmodels t 检验转换数据框

我正在尝试在 pandas/statsmodels 中运行 t 检验来比较两组之间的性能差异,但是我很难以 statsmodels 可以使用的方式(以合理的方式)格式化数据。

我的熊猫数据框目前看起来像这样:

我的理解是,要执行 t 检验,我需要按治疗组织的数据,如下所示:

这段代码几乎可以解决问题:

但是当我打印时,它看起来像是在拉动发生该处理的索引而不是性能值:

它 [也许?] 需要更像这样:

将此数据帧转换为可以执行 t 检验的格式的最佳方法是什么?

0 投票
3 回答
1751 浏览

matlab - 多个类的 T 检验 (>2)

我已阅读以下句子:

与样本数量(通常 50000 个体素对应 1000 个样本)相比,功能性 MRI 数据是高维的。在这种情况下,机器学习算法可能表现不佳。然而,一个简单的统计测试可以帮助减少体素的数量。

学生 t 检验 (scipy.stats.ttest_ind) 执行简单的统计检验,确定两个分布在统计上是否不同。它可用于比较两种不同条件下的体素时间序列(在我们的案例中显示房屋或面孔时)。如果两个条件下的时间序列分布相似,则体素对区分条件不是很感兴趣。

此检验返回的 p 值表示两个时间序列来自同一分布的概率。p 值越低,体素就越有区别。

来自: http: //nilearn.github.io/building_blocks/manipulating_mr_images.html

这个 t 检验也可以应用于 4 个类(条件)吗?如果可以,如何?

是否有可用的 Matlab 实现?

0 投票
1 回答
14889 浏览

r - R中的多重T检验

我在矩阵中有 94 个变量(样本+蛋白质+组)和 172 个观察值:

一些样本在第 0 组,一些在第 1 组。我想使用 t 检验测试第 0 组和第 1 组之间是否存在差异,并且我想对所有蛋白质进行测试。我正在考虑使用应用程序,但我不确定如何使用它。名称也不是 Protein1, protein2... ,它要长得多,所以我不想把它们都写出来。

我也只想要矩阵中每个蛋白质的 p 值,如下所示:

或者类似的东西,这样我就可以找到 p 值低于 0.05/92 的那些。


编辑:

开始以长格式工作这件事不再是一个真正的问题:

0 投票
1 回答
1796 浏览

r - R中的多变量KS测试

因此,我们可以运行 KS 测试来评估 dtwo 数据集的分布是否存在差异,如此处所述

因此,让我们获取以下数据

然后我们可以根据 var3 结果分开

现在我们可以运行 Kolmogorov-Smirnov 检验来检验每个变量分布的差异。

毫不奇怪,我们没有发现差异,并且可以假设不同的数据集是从相同的分布中提取的。这可以通过以下方式可视化:

但是现在我们要考虑当我们同时考虑两者时,两者之间var3==0的分布是否不同。 当我们有多个预测变量时,是否有 R 包来运行这样的测试var3==1var1var2

在这里提出了类似的问题,但没有收到任何答案

似乎有一些文献: 示例 1 示例 2

但似乎没有什么与 R 相关联

0 投票
4 回答
2569 浏览

r - 尝试对每一行执行 t.test 并计算 p 值小于 0.05 的所有行

在过去的四个小时里,我一直在努力寻找 R 问题的解决方案,这让我发疯了。我到处寻找一个体面的答案,但到目前为止,我一直在碰壁。我现在呼吁这个优秀社区的善意帮助。

考虑以下数据集:

我需要对 DataSample 中的每一行执行 t 检验,以确定 TRIAL 和 CONTROL 组是否不同(适用等方差)。

然后我需要计算 p 值等于或小于 0.05的行数。

所以这是我尝试过的代码,我知道这是错误的:

我确实尝试查看有关 stackoverflow 的许多类似问题,但我经常会遇到语法错误或尺寸不匹配。上面的代码是在不返回 R 错误的情况下我能得到的最好的代码——但由于代码返回了错误的答案,我没有什么可骄傲的。

任何建议将不胜感激!在此先感谢您的时间。

0 投票
1 回答
816 浏览

r - 自定义表:SPSS 如何以不同于分类变量的方式处理多响应集?

当涉及到自定义表中的 z 检验时,SPSS 对多响应集的处理与分类变量不同。我认为这种行为与响应的重叠有关,但我不知道如何。

那么,当涉及到多响应集(MRsets)时,SPSS 如何进行 z 检验呢?

我的目标是在 R 中为 MRsets 重现 SPSS z-test,但我无法弄清楚 SPSS 实际做了什么。通常,SPSS 自定义表 z-testing 与

但显然,MRsets 是不同的。

为了清楚起见,请看一下这个分类与 MRset 的比较。


Categorical var z-test (C & D 列根据z-test没有区别)


MRset z-test(表中数字相同,但z-test结果不同:C&D列差异显着)


从 MRset R 代码中可以看出,即使是重叠案例的减法也无济于事。也许它与加权或什么有关?非常感谢您的想法。

可能有用的链接:关于权重和多重响应集的说明

0 投票
1 回答
22606 浏览

python - Python中t检验的置信区间(均值之差)

我正在寻找一种快速方法来获取 Python 中的 t 检验置信区间,以了解均值之间的差异。与 R 中的类似:

出去:

下一个:

考虑到假设检验中显着性区间的重要性(以及最近只报告 p 值的做法受到了多少批评),我在 statsmodels 或 scipy 中都没有发现任何类似的东西,这很奇怪。

0 投票
1 回答
650 浏览

r - 计算 II 类错误

在这种特殊情况下,如何使用 R 计算理论 II 型错误?

0 投票
1 回答
1978 浏览

r - 在 R 的 wald.test 中通过假设

请原谅我是这个论坛的新手。该研究需要检查系数之和= 0。可以使用 c(2)+c(3)+c(4)=0 等 eviews 进行测试,其中 2 是第二项的系数,依此类推。使用 R 的代码是

这给出了错误:wald.test中的错误(b = coef(object = output),Sigma = vcov(object = output),:测试系数和零假设的向量具有不同的长度。根据aod包,文档指定格式为

请帮助进行此测试。