问题标签 [t-test]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
166 浏览

r - 对每一行进行统计测试以在 R 中创建火山图?

我目前在 R 中有一个数据集,其中对于每个基因,我有四个暴露于铜的水蚤(列 2:5)和四个对照水蚤(列 6:9)的 log2 表达式。数据帧的头部如下图所示:

我希望能够创建一个说明差异表达的火山图,因此首先需要为我的每个基因生成 P 值。我考虑过进行 t 检验或 Ebayes 这样做,这是微阵列数据的最佳选择吗?如果是这样,我该如何去做,从而为第一列中的每个基因生成一个 P 值?

谢谢

0 投票
1 回答
37 浏览

r - 获得回归斜率为零的检验的 t 统计量

我每年都有四个不同国家的出生比例数据。我使用代码用四个简单的回归线拟合了这些数据:-

目标是使用 R 计算回归斜率为零的测试的 t 统计量。我该怎么做?另外如何打印/显示带有回归线的图形?

0 投票
0 回答
373 浏览

r - 截断平均值,学生 T 分布,1000 次观察 - R

我有一个问题需要我编写一个程序来模拟具有 7 个自由度的学生 t 分布的 n = 1000 个观察值。

我相信我已经完成了这部分使用

问题的第二部分要求你编写一个程序来计算截断均值,从学生 t 分布中排除低于 5% 和高于 95% 的整个随机样本 xi 的观察值。

我为此做了一些工作,但不确定如何合并我的 R(T 分布的 1000 个样本)

到目前为止,我得到了:

我不确定如何插入 R,也不确定这是否是正确的方法,任何指针都将不胜感激,谢谢

0 投票
1 回答
509 浏览

python - python中的简单t检验,具有差异的CI

在 python 中执行 t 检验并包含差异的 CI 的最直接方法是什么?我看过各种帖子,但一切都不一样,当我自己尝试计算 CI 时,它似乎有点不对……这里:

返回:

但是,当我在 SPSS 中运行相同的测试时,虽然我的 t 和 p 值相同,但 CI 分别为 -31.87286、1.17371,在 R 中也是如此。我似乎找不到正确的方法这将不胜感激。

0 投票
0 回答
770 浏览

r - 在具有多个条件的 R 中对“整洁”数据运行 t.tests

我有一个“整洁”的数据框,并且正在尝试运行一系列 t 检验。第一列包括一系列食物名称。接下来的 3 列包含指定实验条件的 0 或 1 个值。最后一列包括特定食物评分的平均值。

我想运行 t.tests 根据条件比较不同组的平均值。以下是我想运行的 t.tests 类型的一些示例:

  • 比较 var1=0 的所有食物的平均食物分数与 var1=1 的所有食物的平均食物分数
  • 比较 var1=0 和 var2=1 与 var1=1 和 var2=0 的所有食物的平均食物得分

以下是示例的一些伪代码:

我如何在 R 中做到这一点?

0 投票
1 回答
104 浏览

r - R. 使用 t 检验,将个人平均值与全局平均值进行比较

我有一个这种形式的巨大矩阵,有 1000000 行和 10000 列。这是一个玩具示例:

“平均值”列中的行表示每行的 A、B 和 C 的平均值。另一方面,“平均值”列的全局平均值为 3.58。我想知道,使用 t 检验和 R,每行的平均值是否明显高于全局平均值。我怎样才能得到p值进行比较?使用 t.test() 比较两组之间的平均值非常简单,但我无法找到如何将单个值与包含该值的组的平均值进行比较。

0 投票
0 回答
61 浏览

r - 手动执行 t 检验选择

我正在尝试编写模拟代码,生成数据并在其上运行 t 检验选择(丢弃那些 t 检验 p 值超过 0.05 的预测变量,保留其余部分)。该模拟很大程度上是对 Kleiber 和 Zeileis (2008, pp. 183–189) 的 Applied Econometrics with R 的改编。

运行代码时,通常会失败。然而,对于某些种子(例如 1534),它会产生合理的输出。如果它不产生输出(例如 1911),它会由于以下原因而失败:"Error in x[, ii] : subscript out of bounds",它追溯到na.omit.data.frame()。因此,出于某种原因,我尝试处理 NA 的方式似乎失败了,但我无法弄清楚是怎么回事。

第一个块不太可能是错误的原因。它仅生成数据,并且可以独立运行,也可以与其他方法(如 PCA)一起使用。第二个块从回归输出中提取 p 值;删除截距的 p 值 (beta_0);并根据需要用尽可能多的 7 填充向量,使其长度与变量数相同,以确保矩阵计算的维度相同。七是任意的,可以是大于 0.05 的任何数字,以不通过循环测试。如果 R 由于多重共线性而丢弃预测变量,这将成为 - 我相信 - 必要的。

最后一个块创建一个原始维度的空矩阵;插入原始数据,如果t检验p值低于0.05,否则保留NA;而倒数第二行删除了所有包含 NA 的列((此处仅 NA 或一个 NA 相同)取自 mnel 对Remove columns from dataframe where ALL values are NA的回答);最后,修改后的数据再次以线性回归的形式放置。

有谁知道导致这种行为的原因或它如何按预期工作?我希望它要么工作要么不工作,但不是两者兼而有之。理想情况下,前者。

代码的工作版本是:

前作:

我知道不建议通过单个预测变量的重要性来选择模型,但这就是重点——它旨在与更复杂的方法进行比较。

0 投票
1 回答
72 浏览

r - 返回数据框的回归 p 值和 t.test p 值

我正在尝试编写一个接收数据框的函数。数据框的df$x列由两个因子水平组成。df$y是一个连续随机变量。这是我到目前为止所拥有的:

我的回归 p 值有效,但因子 t.test p 值无效。

例如, sim2 是:

对于那些宁愿看 dput(sim2) 的人:

我的功能:

应该返回

0 投票
1 回答
233 浏览

python-3.x - 如何将 csv 数据集列中的值导入 python 进行 t 检验?

这里有新的编码器,试图在 Python 3.6 中运行一些 t 检验。现在,为了在我的 2 个数据集之间运行我的 t 检验,我一直在执行以下操作:

这需要我为每个特定基因(在本例中为 GENE1)手动输入两个数据集的每一列的值。有什么方法可以调用数据集中的值,这样 Python 就可以读取这些值,而无需我自己输入它们?例如,我可以说某种方式:

感谢您的帮助,很抱歉我对这些东西不是很精通。感谢任何反馈/提示。如果您有任何其他问题,请告诉我!

0 投票
1 回答
1517 浏览

r - R中的两个样本t检验:比较方向?

假设我有吸烟者和非吸烟者的肺活量数据。所以我们有一个带有数值的变量“lungCap”,以及带有“yes”或“no”值的变量“Smoking”。现在我想看看非吸烟者的容量是否大于吸烟者:

现在测试是否计算"yes" > "no""no" > "yes"?这是如何确定的?我在 t.test 命令的帮助中找不到它。