问题标签 [hypothesis-test]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

302 问题

0 投票

2 回答

2914 浏览

r - R中的配对t检验

我正在尝试在 R 中对按因素分组的数据进行配对 t 检验：

我首先尝试使用：

但我得到了错误

complete.cases(x, y) 中的错误：并非所有参数都具有相同的长度

这对我来说没有多大意义。

我考虑过使用ddply()、apply()和summaryBy()，但无法让它工作，因为配对 t 检验的输入需要 2 个向量，而我提到的大多数前面的函数似乎在只有一列被“操作”时效果最好。

为了解决这个问题，我尝试使用 for 循环来达到相同的目的：

但是，当我这样做时，我得到了错误

成对 || !is.null(y) : x||y 中的“x”类型无效

所以我检查了typeof(pair_sub$Ins)。原来那个类型是双精度的，它是数字的，所以我不确定为什么配对 t 检验不起作用。关于如何解决这两种方法的任何想法？

r for-loop hypothesis-test

2015-03-15T20:31:38.357

0 投票

1 回答

633 浏览

python - 为 statsmodels t 检验转换数据框

我正在尝试在 pandas/statsmodels 中运行 t 检验来比较两组之间的性能差异，但是我很难以 statsmodels 可以使用的方式（以合理的方式）格式化数据。

我的熊猫数据框目前看起来像这样：

我的理解是，要执行 t 检验，我需要按治疗组织的数据，如下所示：

这段代码几乎可以解决问题：

但是当我打印时，它看起来像是在拉动发生该处理的索引而不是性能值：

它 [也许？] 需要更像这样：

将此数据帧转换为可以执行 t 检验的格式的最佳方法是什么？

python pandas statistics statsmodels hypothesis-test

2015-04-08T20:06:53.517

0 投票

3 回答

1751 浏览

matlab - 多个类的 T 检验 (>2)

我已阅读以下句子：

与样本数量（通常 50000 个体素对应 1000 个样本）相比，功能性 MRI 数据是高维的。在这种情况下，机器学习算法可能表现不佳。然而，一个简单的统计测试可以帮助减少体素的数量。

学生 t 检验 (scipy.stats.ttest_ind) 执行简单的统计检验，确定两个分布在统计上是否不同。它可用于比较两种不同条件下的体素时间序列（在我们的案例中显示房屋或面孔时）。如果两个条件下的时间序列分布相似，则体素对区分条件不是很感兴趣。

此检验返回的 p 值表示两个时间序列来自同一分布的概率。p 值越低，体素就越有区别。

来自： http: //nilearn.github.io/building_blocks/manipulating_mr_images.html

这个 t 检验也可以应用于 4 个类（条件）吗？如果可以，如何？

是否有可用的 Matlab 实现？

matlab machine-learning feature-extraction p-value hypothesis-test

2015-05-25T23:49:24.663

0 投票

1 回答

14889 浏览

r - R中的多重T检验

我在矩阵中有 94 个变量（样本+蛋白质+组）和 172 个观察值：

一些样本在第 0 组，一些在第 1 组。我想使用 t 检验测试第 0 组和第 1 组之间是否存在差异，并且我想对所有蛋白质进行测试。我正在考虑使用应用程序，但我不确定如何使用它。名称也不是 Protein1, protein2... ，它要长得多，所以我不想把它们都写出来。

我也只想要矩阵中每个蛋白质的 p 值，如下所示：

或者类似的东西，这样我就可以找到 p 值低于 0.05/92 的那些。

编辑：

开始以长格式工作这件事不再是一个真正的问题：

r hypothesis-test

2015-06-30T13:38:25.793

0 投票

1 回答

1796 浏览

r - R中的多变量KS测试

因此，我们可以运行 KS 测试来评估 dtwo 数据集的分布是否存在差异，如此处所述。

因此，让我们获取以下数据

然后我们可以根据 var3 结果分开

现在我们可以运行 Kolmogorov-Smirnov 检验来检验每个变量分布的差异。

毫不奇怪，我们没有发现差异，并且可以假设不同的数据集是从相同的分布中提取的。这可以通过以下方式可视化：

但是现在我们要考虑当我们同时考虑两者时，两者之间var3==0的分布是否不同。 当我们有多个预测变量时，是否有 R 包来运行这样的测试var3==1var1var2

在这里提出了类似的问题，但没有收到任何答案

似乎有一些文献：示例 1 示例 2

但似乎没有什么与 R 相关联

r distribution hypothesis-test

2015-07-22T12:35:52.177

0 投票

4 回答

2569 浏览

r - 尝试对每一行执行 t.test 并计算 p 值小于 0.05 的所有行

在过去的四个小时里，我一直在努力寻找 R 问题的解决方案，这让我发疯了。我到处寻找一个体面的答案，但到目前为止，我一直在碰壁。我现在呼吁这个优秀社区的善意帮助。

考虑以下数据集：

我需要对 DataSample 中的每一行执行 t 检验，以确定 TRIAL 和 CONTROL 组是否不同（适用等方差）。

然后我需要计算 p 值等于或小于 0.05的行数。

所以这是我尝试过的代码，我知道这是错误的：

我确实尝试查看有关 stackoverflow 的许多类似问题，但我经常会遇到语法错误或尺寸不匹配。上面的代码是在不返回 R 错误的情况下我能得到的最好的代码——但由于代码返回了错误的答案，我没有什么可骄傲的。

任何建议将不胜感激！在此先感谢您的时间。

r statistics hypothesis-test

2015-07-23T19:40:29.067

0 投票

1 回答

816 浏览

r - 自定义表：SPSS 如何以不同于分类变量的方式处理多响应集？

当涉及到自定义表中的 z 检验时，SPSS 对多响应集的处理与分类变量不同。我认为这种行为与响应的重叠有关，但我不知道如何。

那么，当涉及到多响应集（MRsets）时，SPSS 如何进行 z 检验呢？

我的目标是在 R 中为 MRsets 重现 SPSS z-test，但我无法弄清楚 SPSS 实际做了什么。通常，SPSS 自定义表 z-testing 与

但显然，MRsets 是不同的。

为了清楚起见，请看一下这个分类与 MRset 的比较。

Categorical var z-test (C & D 列根据z-test没有区别)

分类数据集（无重叠，3623 例）：下载数据集
分类重叠矩阵（无重叠）：
分类 z 检验 SPSS 语法
/li>
分类 z 检验输出：
C<->D z 测试的 R 再现（第一行）：http ://www.r-fiddle.org/#/fiddle?id=p4gw9ftk
/li>

MRset z-test（表中数字相同，但z-test结果不同：C&D列差异显着）

MRset 数据集（包括重叠，2404 个案例）：下载数据集
MRset重叠矩阵：
MRset z 测试输出：
MRset z-test SPSS 语法：
/li>
C<->D z 测试的 R 再现（第一行）：http ://www.r-fiddle.org/#/fiddle?id=GAhnnrv0
/li>

从 MRset R 代码中可以看出，即使是重叠案例的减法也无济于事。也许它与加权或什么有关？非常感谢您的想法。

可能有用的链接：关于权重和多重响应集的说明

r statistics spss significance hypothesis-test

2015-07-28T10:05:18.847

0 投票

1 回答

22606 浏览

python - Python中t检验的置信区间（均值之差）

我正在寻找一种快速方法来获取 Python 中的 t 检验置信区间，以了解均值之间的差异。与 R 中的类似：

出去：

下一个：

考虑到假设检验中显着性区间的重要性（以及最近只报告 p 值的做法受到了多少批评），我在 statsmodels 或 scipy 中都没有发现任何类似的东西，这很奇怪。

python statistics hypothesis-test

2015-08-02T04:06:57.840

0 投票

1 回答

650 浏览

r - 计算 II 类错误

在这种特殊情况下，如何使用 R 计算理论 II 型错误？

r hypothesis-test

2015-08-24T15:42:37.533

0 投票

1 回答

1978 浏览

r - 在 R 的 wald.test 中通过假设

请原谅我是这个论坛的新手。该研究需要检查系数之和= 0。可以使用 c(2)+c(3)+c(4)=0 等 eviews 进行测试，其中 2 是第二项的系数，依此类推。使用 R 的代码是

这给出了错误：wald.test中的错误（b = coef（object = output），Sigma = vcov（object = output），：测试系数和零假设的向量具有不同的长度。根据aod包，文档指定格式为

请帮助进行此测试。

r lag lm hypothesis-test

2015-09-21T04:15:05.413

1 2 3 4 5 6 7 8 9 10