问题标签 [hypothesis-test]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R中的配对t检验
我正在尝试在 R 中对按因素分组的数据进行配对 t 检验:
我首先尝试使用:
但我得到了错误
complete.cases(x, y) 中的错误:并非所有参数都具有相同的长度
这对我来说没有多大意义。
我考虑过使用ddply()
、apply()
和summaryBy()
,但无法让它工作,因为配对 t 检验的输入需要 2 个向量,而我提到的大多数前面的函数似乎在只有一列被“操作”时效果最好。
为了解决这个问题,我尝试使用 for 循环来达到相同的目的:
但是,当我这样做时,我得到了错误
成对 || !is.null(y) : x||y 中的“x”类型无效
所以我检查了typeof(pair_sub$Ins)
。原来那个类型是双精度的,它是数字的,所以我不确定为什么配对 t 检验不起作用。关于如何解决这两种方法的任何想法?
python - 为 statsmodels t 检验转换数据框
我正在尝试在 pandas/statsmodels 中运行 t 检验来比较两组之间的性能差异,但是我很难以 statsmodels 可以使用的方式(以合理的方式)格式化数据。
我的熊猫数据框目前看起来像这样:
我的理解是,要执行 t 检验,我需要按治疗组织的数据,如下所示:
这段代码几乎可以解决问题:
但是当我打印时,它看起来像是在拉动发生该处理的索引而不是性能值:
它 [也许?] 需要更像这样:
将此数据帧转换为可以执行 t 检验的格式的最佳方法是什么?
matlab - 多个类的 T 检验 (>2)
我已阅读以下句子:
与样本数量(通常 50000 个体素对应 1000 个样本)相比,功能性 MRI 数据是高维的。在这种情况下,机器学习算法可能表现不佳。然而,一个简单的统计测试可以帮助减少体素的数量。
学生 t 检验 (scipy.stats.ttest_ind) 执行简单的统计检验,确定两个分布在统计上是否不同。它可用于比较两种不同条件下的体素时间序列(在我们的案例中显示房屋或面孔时)。如果两个条件下的时间序列分布相似,则体素对区分条件不是很感兴趣。
此检验返回的 p 值表示两个时间序列来自同一分布的概率。p 值越低,体素就越有区别。
来自: http: //nilearn.github.io/building_blocks/manipulating_mr_images.html
这个 t 检验也可以应用于 4 个类(条件)吗?如果可以,如何?
是否有可用的 Matlab 实现?
r - R中的多重T检验
我在矩阵中有 94 个变量(样本+蛋白质+组)和 172 个观察值:
一些样本在第 0 组,一些在第 1 组。我想使用 t 检验测试第 0 组和第 1 组之间是否存在差异,并且我想对所有蛋白质进行测试。我正在考虑使用应用程序,但我不确定如何使用它。名称也不是 Protein1, protein2... ,它要长得多,所以我不想把它们都写出来。
我也只想要矩阵中每个蛋白质的 p 值,如下所示:
或者类似的东西,这样我就可以找到 p 值低于 0.05/92 的那些。
编辑:
开始以长格式工作这件事不再是一个真正的问题:
r - R中的多变量KS测试
r - 尝试对每一行执行 t.test 并计算 p 值小于 0.05 的所有行
在过去的四个小时里,我一直在努力寻找 R 问题的解决方案,这让我发疯了。我到处寻找一个体面的答案,但到目前为止,我一直在碰壁。我现在呼吁这个优秀社区的善意帮助。
考虑以下数据集:
我需要对 DataSample 中的每一行执行 t 检验,以确定 TRIAL 和 CONTROL 组是否不同(适用等方差)。
然后我需要计算 p 值等于或小于 0.05的行数。
所以这是我尝试过的代码,我知道这是错误的:
我确实尝试查看有关 stackoverflow 的许多类似问题,但我经常会遇到语法错误或尺寸不匹配。上面的代码是在不返回 R 错误的情况下我能得到的最好的代码——但由于代码返回了错误的答案,我没有什么可骄傲的。
任何建议将不胜感激!在此先感谢您的时间。
r - 自定义表:SPSS 如何以不同于分类变量的方式处理多响应集?
当涉及到自定义表中的 z 检验时,SPSS 对多响应集的处理与分类变量不同。我认为这种行为与响应的重叠有关,但我不知道如何。
那么,当涉及到多响应集(MRsets)时,SPSS 如何进行 z 检验呢?
我的目标是在 R 中为 MRsets 重现 SPSS z-test,但我无法弄清楚 SPSS 实际做了什么。通常,SPSS 自定义表 z-testing 与
但显然,MRsets 是不同的。
为了清楚起见,请看一下这个分类与 MRset 的比较。
Categorical var z-test (C & D 列根据z-test没有区别)
- 分类数据集(无重叠,3623 例):下载数据集
- 分类重叠矩阵(无重叠):
分类 z 检验 SPSS 语法
/li>C<->D z 测试的 R 再现(第一行):http ://www.r-fiddle.org/#/fiddle?id=p4gw9ftk
/li>
MRset z-test(表中数字相同,但z-test结果不同:C&D列差异显着)
- MRset 数据集(包括重叠,2404 个案例):下载数据集
- MRset重叠矩阵:
- MRset z 测试输出:
MRset z-test SPSS 语法:
/li>C<->D z 测试的 R 再现(第一行):http ://www.r-fiddle.org/#/fiddle?id=GAhnnrv0
/li>
从 MRset R 代码中可以看出,即使是重叠案例的减法也无济于事。也许它与加权或什么有关?非常感谢您的想法。
可能有用的链接:关于权重和多重响应集的说明
python - Python中t检验的置信区间(均值之差)
我正在寻找一种快速方法来获取 Python 中的 t 检验置信区间,以了解均值之间的差异。与 R 中的类似:
出去:
下一个:
考虑到假设检验中显着性区间的重要性(以及最近只报告 p 值的做法受到了多少批评),我在 statsmodels 或 scipy 中都没有发现任何类似的东西,这很奇怪。
r - 计算 II 类错误
在这种特殊情况下,如何使用 R 计算理论 II 型错误?
r - 在 R 的 wald.test 中通过假设
请原谅我是这个论坛的新手。该研究需要检查系数之和= 0。可以使用 c(2)+c(3)+c(4)=0 等 eviews 进行测试,其中 2 是第二项的系数,依此类推。使用 R 的代码是
这给出了错误:wald.test中的错误(b = coef(object = output),Sigma = vcov(object = output),:测试系数和零假设的向量具有不同的长度。根据aod包,文档指定格式为
请帮助进行此测试。