“t-test”的相关标签问题_Stack Overflow中文网

0 投票

0 回答

166 浏览

r - 对每一行进行统计测试以在 R 中创建火山图？

我目前在 R 中有一个数据集，其中对于每个基因，我有四个暴露于铜的水蚤（列 2:5）和四个对照水蚤（列 6:9）的 log2 表达式。数据帧的头部如下图所示：

我希望能够创建一个说明差异表达的火山图，因此首先需要为我的每个基因生成 P 值。我考虑过进行 t 检验或 Ebayes 这样做，这是微阵列数据的最佳选择吗？如果是这样，我该如何去做，从而为第一列中的每个基因生成一个 P 值？

谢谢

r t-test limma

2018-01-25T14:40:38.073

0 投票

1 回答

37 浏览

r - 获得回归斜率为零的检验的 t 统计量

我每年都有四个不同国家的出生比例数据。我使用代码用四个简单的回归线拟合了这些数据：-

目标是使用 R 计算回归斜率为零的测试的 t 统计量。我该怎么做？另外如何打印/显示带有回归线的图形？

r statistics t-test

2018-01-25T20:42:45.240

0 投票

0 回答

373 浏览

r - 截断平均值，学生 T 分布，1000 次观察 - R

我有一个问题需要我编写一个程序来模拟具有 7 个自由度的学生 t 分布的 n = 1000 个观察值。

我相信我已经完成了这部分使用

问题的第二部分要求你编写一个程序来计算截断均值，从学生 t 分布中排除低于 5% 和高于 95% 的整个随机样本 xi 的观察值。

我为此做了一些工作，但不确定如何合并我的 R（T 分布的 1000 个样本）

到目前为止，我得到了：

我不确定如何插入 R，也不确定这是否是正确的方法，任何指针都将不胜感激，谢谢

r distribution t-test

2018-02-01T18:25:53.900

0 投票

1 回答

509 浏览

python - python中的简单t检验，具有差异的CI

在 python 中执行 t 检验并包含差异的 CI 的最直接方法是什么？我看过各种帖子，但一切都不一样，当我自己尝试计算 CI 时，它似乎有点不对……这里：

返回：

但是，当我在 SPSS 中运行相同的测试时，虽然我的 t 和 p 值相同，但 CI 分别为 -31.87286、1.17371，在 R 中也是如此。我似乎找不到正确的方法这将不胜感激。

python statistics t-test

2018-02-10T12:10:17.843

0 投票

0 回答

770 浏览

r - 在具有多个条件的 R 中对“整洁”数据运行 t.tests

我有一个“整洁”的数据框，并且正在尝试运行一系列 t 检验。第一列包括一系列食物名称。接下来的 3 列包含指定实验条件的 0 或 1 个值。最后一列包括特定食物评分的平均值。

我想运行 t.tests 根据条件比较不同组的平均值。以下是我想运行的 t.tests 类型的一些示例：

比较 var1=0 的所有食物的平均食物分数与 var1=1 的所有食物的平均食物分数
比较 var1=0 和 var2=1 与 var1=1 和 var2=0 的所有食物的平均食物得分

以下是示例的一些伪代码：

我如何在 R 中做到这一点？

r tidyverse t-test

2018-02-14T04:49:36.240

0 投票

1 回答

104 浏览

r - R. 使用 t 检验，将个人平均值与全局平均值进行比较

我有一个这种形式的巨大矩阵，有 1000000 行和 10000 列。这是一个玩具示例：

“平均值”列中的行表示每行的 A、B 和 C 的平均值。另一方面，“平均值”列的全局平均值为 3.58。我想知道，使用 t 检验和 R，每行的平均值是否明显高于全局平均值。我怎样才能得到p值进行比较？使用 t.test() 比较两组之间的平均值非常简单，但我无法找到如何将单个值与包含该值的组的平均值进行比较。

r t-test

2018-03-08T20:51:48.770

0 投票

0 回答

61 浏览

r - 手动执行 t 检验选择

我正在尝试编写模拟代码，生成数据并在其上运行 t 检验选择（丢弃那些 t 检验 p 值超过 0.05 的预测变量，保留其余部分）。该模拟很大程度上是对 Kleiber 和 Zeileis (2008, pp. 183–189) 的 Applied Econometrics with R 的改编。

运行代码时，通常会失败。然而，对于某些种子（例如 1534），它会产生合理的输出。如果它不产生输出（例如 1911），它会由于以下原因而失败："Error in x[, ii] : subscript out of bounds"，它追溯到na.omit.data.frame()。因此，出于某种原因，我尝试处理 NA 的方式似乎失败了，但我无法弄清楚是怎么回事。

第一个块不太可能是错误的原因。它仅生成数据，并且可以独立运行，也可以与其他方法（如 PCA）一起使用。第二个块从回归输出中提取 p 值；删除截距的 p 值 (beta_0)；并根据需要用尽可能多的 7 填充向量，使其长度与变量数相同，以确保矩阵计算的维度相同。七是任意的，可以是大于 0.05 的任何数字，以不通过循环测试。如果 R 由于多重共线性而丢弃预测变量，这将成为 - 我相信 - 必要的。

最后一个块创建一个原始维度的空矩阵；插入原始数据，如果t检验p值低于0.05，否则保留NA；而倒数第二行删除了所有包含 NA 的列（（此处仅 NA 或一个 NA 相同）取自 mnel 对Remove columns from dataframe where ALL values are NA的回答）；最后，修改后的数据再次以线性回归的形式放置。

有谁知道导致这种行为的原因或它如何按预期工作？我希望它要么工作要么不工作，但不是两者兼而有之。理想情况下，前者。

代码的工作版本是：

前作：

我知道不建议通过单个预测变量的重要性来选择模型，但这就是重点——它旨在与更复杂的方法进行比较。

r dimensionality-reduction t-test

2018-03-22T13:20:39.177

0 投票

1 回答

72 浏览

r - 返回数据框的回归 p 值和 t.test p 值

我正在尝试编写一个接收数据框的函数。数据框的df$x列由两个因子水平组成。df$y是一个连续随机变量。这是我到目前为止所拥有的：

我的回归 p 值有效，但因子 t.test p 值无效。

例如， sim2 是：

对于那些宁愿看 dput(sim2) 的人：

我的功能：

应该返回

r vector p-value t-test

2018-04-02T19:33:43.413

0 投票

1 回答

233 浏览

python-3.x - 如何将 csv 数据集列中的值导入 python 进行 t 检验？

这里有新的编码器，试图在 Python 3.6 中运行一些 t 检验。现在，为了在我的 2 个数据集之间运行我的 t 检验，我一直在执行以下操作：

这需要我为每个特定基因（在本例中为 GENE1）手动输入两个数据集的每一列的值。有什么方法可以调用数据集中的值，这样 Python 就可以读取这些值，而无需我自己输入它们？例如，我可以说某种方式：

感谢您的帮助，很抱歉我对这些东西不是很精通。感谢任何反馈/提示。如果您有任何其他问题，请告诉我！

python-3.x pandas csv statistics t-test

2018-04-10T20:49:39.130

0 投票

1 回答

1517 浏览

r - R中的两个样本t检验：比较方向？

假设我有吸烟者和非吸烟者的肺活量数据。所以我们有一个带有数值的变量“lungCap”，以及带有“yes”或“no”值的变量“Smoking”。现在我想看看非吸烟者的容量是否大于吸烟者：

现在测试是否计算"yes" > "no"或"no" > "yes"？这是如何确定的？我在 t.test 命令的帮助中找不到它。

r statistics t-test

2018-04-15T06:31:42.610

问题标签 [t-test]

Reference