问题标签 [t-test]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
715 浏览

r - Conducting a t-test across two different data frames with switched rows/columns?

Sorry for the confusing title, this one's a bit hard to describe. Basically, I've got two data tables which look similar to this:

So all the entries in df1 correspond to column names in df2. My goal is to fill df1$pval with the p-values from a t-test. For every row in df1, I want to do a t-test comparing the df2 column that matches the value of df1$SNP, and compares that against the df2 column that matches the value of df1$Gene.ID.

For example, for the first row in df1, I would want to compare df2$W vs. df2$A, and then return the resulting p-value inside of df1[1, 3]. For the second row, I would compare df2$X vs. df2$B and return the p-value in df1[2, 3]. In other words, something like this:

But this does not work because you can only select multiple column names using the colnames function, not just a single column name. Suggestions for how to get around this would be greatly appreciated--or if you have a simpler method in mind, that would be great too.

0 投票
2 回答
816 浏览

r - 如何在 R 中执行双尾 2 样本 t 检验

我在创建双尾 2 样本 t 检验时遇到了问题。给出的唯一值是以下值。我们有S组和L组,分别有期中和期末考试。我的任务是对期中分数进行一次双尾 2 样本 t 检验,然后对期中到期末考试的分数差异进行一次检验。

结果应该是:

  • 期中考试:(t: -1.24, p:0.219 > 0.01, Cohen's d: -0.286)
  • 决赛:(t:2.30, p:0.024 > 0.01, Cohen's d:0.532)

我没有得到这些结果。我怎样才能在 R 中正确实现测试?

编辑:我已经有以下内容:

上面的代码仅用于比较中间项。首先,我认为我必须创建具有给定值的法线向量。然后我将它们放在一个数据框中,并用 0 或 1 标记它们,无论它们来自 (S) 还是 (L)。这或多或少是解决任务的正确方法吗?因为结果得到的 p 值太小。

0 投票
1 回答
2939 浏览

apache-spark - 如何在 Spark 中执行简单的 t 检验?

我的目标是使用https://spark.apache.org/docs/2.0.2/api/java/org/apache/spark/mllib/stat/test/StudentTTest上记录的方法在 Spark Scala 中执行 t 检验.html。假设我的数据在数据框中给出:

现在,我试过了

但这给了我一个错误:<console>:29: error: object StudentTTest in package test cannot be accessed in package org.apache.spark.mllib.stat.test

我究竟做错了什么?

0 投票
1 回答
547 浏览

python - 为什么 scipy 和 Excel 为两个样本 t 检验生成略有不同的 p 值?

对于python,默认为两侧测试

我有

Excel, Datatab - Data Analysis-t-Test: Two-Sample Assuming Unequal Variances中,我得到了相同的值,但(0.1084... vs 0.1082...)t的值略有不同p

我能问为什么吗?

在此处输入图像描述

0 投票
2 回答
290 浏览

r - 大数据框:千个因素的组间“重复”t检验

我已经阅读了很多与数据争吵和“重复”t 检验相关的帖子,但我无法弄清楚在我的情况下实现它的方法。

您可以在此处获取 StackOverflow 的示例数据集:https ://www.dropbox.com/s/0b618fs1jjnuzbg/dataset.example.stckovflw.txt?dl=0

我有一个 gen 表达式的大数据框,例如:

每组有5只动物,每只动物有许多量化的基因。(然而,每只动物可能有一组不同的量化基因组,而且许多基因组在动物和群体之间是共同的)。

我想对我的治疗组(A、B、C 或 D)和对照组之间的每一代进行 t 检验。数据应以表格形式呈现,其中包含每组中每个基因的 p 值。

因为我有这么多的基因(千),所以我不能对每个基因进行子集化。

你知道我怎样才能自动化这个过程吗?

我正在考虑一个循环,但我绝对不确定它能否实现我想要的以及如何进行。

此外,我正在使用以下apply函数查看这些帖子:Apply t-test on many columns in a dataframe split by factor and Looping through t.tests for data frame subsets in r

################ 阅读第一条评论和答案后的附加信息:

@andrew_reece:非常感谢你。这几乎正​​是我想要的。但是,我找不到使用 t 检验的方法。ANOVA 是有趣的信息,但我需要知道哪些治疗组与我的对照组有显着差异。我还需要知道哪个治疗组彼此之间存在显着差异,“两个两个”。

我一直在尝试通过更改“t.test(...)”中的“aov(..)”来使用您的代码。为此,首先我实现了一个子集(b, condition == "control" | condition == "treatmentA" ),以便仅比较两组。但是,在 csv 文件中导出结果表时,该表是无法理解的(没有生成名称、没有 p 值等,只有数字)。我将继续寻找一种方法来正确地做到这一点,但直到现在我被困住了。

@42:

非常感谢您提供这些提示。这只是一个数据集示例,假设我们必须使用单独的 t 检验。

这是探索我的数据的非常有用的开始。例如,我一直在尝试用 Venndiagrams 表示我的数据。我可以编写我的代码,但这有点超出最初的主题。另外,我不知道如何以不那么挑剔的方式总结在每种条件组合中检测到的共享“基因”,所以我只用 3 个条件进行了简化。

在此处输入图像描述

0 投票
1 回答
215 浏览

r - R Studio T 测试

我正在 RStudio 中完成一项任务,检查汽车制造商及其碰撞安全等级之间的差异。现在我只想测试黑白福特和雪佛兰,但“品牌”类别还有另外 20 个品牌。为了使用这些变量执行简单的 T 测试,我尝试了

t.test(Head_IC~make,alternative=“two.lateral”,配对=T)

这给了我

“分组因子必须恰好有 2 个级别”

我在堆栈上环顾四周,发现人们通常使用逗号来修复此错误。我发现如果我放置一个逗号黑白“Head_IC”和“make”,我会得到另一个单独的错误。我的问题是我的 x 和 y 值吗?还是 b/c “make” 由几个不同的品牌组成?谢谢您的帮助!

0 投票
1 回答
47 浏览

r - t 测试将一行(参考样本)与数据框中的所有其他行进行比较

我在下面有一部分数据(数据集)。它总结了用不同药物处理细胞后的细胞活力(实际数据集有 1200 种药物)。实验一式三份进行(样品 1、2 和 3)。为了简单起见,我在下面生成了一个小数据集:

我想在测试中比较未经处理的细胞活力值与我使用的每种药物。

我尝试使用 for 循环,但它不起作用:

0 投票
2 回答
638 浏览

r - R 为每行运行 T 检验/方差分析,每行有 2 组,有 3 个样本

我的数据集看起来像这样:

我想对列 [2:4] 和 [5:7] 列上的每一行(复合)执行 t 检验,并存储所有 p 值。基本上看每个化合物的AC组和AM组是否有区别。

我知道还有另一个主题,但是我找不到解决我的问题的可行解决方案。

PS。我的真实数据集大约有 35000 行(也许它需要一个与只有 4 行不同的解决方案)

0 投票
1 回答
2452 浏览

python - 如何使用任何类似于 R 的统计库在 python 中执行两个样本 t 测试?

我可以在 R 中为 2 个样本 T 检验执行此操作:

我想要一些函数,我可以在 Python ttest 中传递这个 mu(均值差)参数?

0 投票
1 回答
63 浏览

pandas - 打印和存储 t-test 循环的结果

我有一个数据集,其中包含几个自变量和几个我想运行多个 t 检验的因变量。我所有的独立变量都是假人,而我的依赖变量是数字。

我写了以下循环:

我运行代码,但脚本不打印结果(不知道为什么..)。另外,我想将差异和 p 值存储在数据框中,以便稍后绘制它们.. 怎么做?谢谢!