问题标签 [t-test]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
43 浏览

r - 我想进行 t 检验,我应该如何组织我的数据呢?

在 R 中,我想运行一个统计测试来比较两个类别之间的平均值,但我不知道如何组织我的数据来做到这一点。

模拟示例

我的数据组织如下:

我想做的是将每个性别的平均值与 Welch t 检验进行比较,回答“女性的年龄与男性的年龄有显着差异吗?”这个问题。

从理论上讲,要运行测试,我认为我的数据应该采用以下形式:

我确信有一种方法可以直接在原始表上运行测试,或者有一种简单的方法可以将我的数据转换为这种形式......

那么,我应该如何进行呢?

0 投票
0 回答
1576 浏览

r - 使用马氏距离确定组间差异的 Hotelling 的 T^2 测试示例

我正在尝试按照出版物中描述的程序来确定组之间的分离是否具有统计学意义。该出版物的水平高于我的知识水平,但我正在尝试逐步接近它。

为了澄清和简单起见,以鸢尾花数据集为例,并在 R 中进行分析。正如 PCA 图所示,该方法应该使我能够确定组/物种之间的距离是否显着不同。
Iris Species PCA 图

据我了解,要获得此结果,该过程包括以下四个步骤:

  1. 距离计算:使用来自前两个主成分的组质心之间的马氏距离。
  2. 学生 t 检验:采用 Hotelling 的双样本 T^2 统计量来确定是否分离 btw。聚类具有统计学意义。
  3. 计算 F 统计量:将 T^2 统计量转换为 F 值并计算 F 检验以指示集群之间是否存在分离。
  4. 使用 F 统计量执行假设检验:如果 F 值大于临界 F 值,则可以拒绝假设组之间没有分离的原假设。

我被困在第一步和第二步之间。如何使用 Mahalanobis 距离计算的结果进行 Hotelling 的 T^2 检验。

MWE如下:

马氏距离计算返回三个距离

就比例而言,它们似乎与 PCA 图所示的相当。对前两个主成分的Hotelling T2 检验对所有三个比较都返回显着结果。但我想知道如何使用参考出版物中所述的先前马氏距离计算进行 T 检验?

0 投票
1 回答
113 浏览

python - Python - 使用标准误差执行估计的 t 检验

我想知道是否有一种方法可以对估计值执行双尾 t 检验,考虑到它的标准误差和自由度的数量?估计是从另一个软件中读取的。我一直在 Excel 中使用 t.dist.2t(abs(estimate/SE), df) ,但是直接在 Python 中使用它会有很大的帮助....

0 投票
2 回答
1073 浏览

python - Python:统计 T 检验

我正在使用 python 3.6 对数据集运行一些统计测试。我想要完成的是在数据集和趋势线之间运行 t 检验以确定统计显着性。我和使用 scipy 来做到这一点但是我不确定我应该在测试中包含哪些变量以获得我需要的结果。

到目前为止,这是我的代码:

现在代码正在运行,没有错误消息,但是我得到了一个非常小的 p 值,我认为它是不正确的。如果有人知道我应该将哪些变量写入 t 检验,那将非常有帮助。谢谢!

0 投票
3 回答
713 浏览

r - R for循环与成对变量

我是编程新手(即循环和 if-else 语句),但对 R 中的统计数据并不陌生。

我有大约 16 个特征要在 5 个不同人群中的男性和女性之间进行比较,因此是 5x16 比较。我首先要检查男性和女性特征方差是否相等(var.test),然后使用此信息来确定 t.test 函数的正确版本(var = T 或 var = F)。我正在尝试编写一个循环来自动化这个过程。

我写了一个有效的 if-else 语句:

但我似乎无法弄清楚如何将其应用于我的所有特征。

我不想使用两个嵌套的 for 语句:

因为这会创建一个矩阵,对所有特征组合执行 var.test 和 t.test 。然而,我只希望每个特征的男性和女性版本配对。

这是我的数据格式。我制作了两个数据子集(男性和女性):

0 投票
0 回答
902 浏览

r - data.table 使用 t.test 比较组

我有以下数据结构。

我想做的是在按 var1 分组的 gp1 和 gp2 之间执行 t.test。当只有一列数据使用以下内容时,我已经阅读了其他一些帖子:

我一生无法弄清楚的是如何在所有其他列(即 V2 到 V5)上做到这一点。这些小插曲有助于指出使用 lapply(.SD, somefunction) 来迭代列,但在这种情况下,我不太确定如何让它为我工作。

上面的示例是一个玩具示例,我实际上正在处理数百万行数据和数百列,所以速度是一个问题。我目前正在使用嵌套应用来遍历行和列,并且该函数需要数小时才能运行。我希望有更快的东西。

如果我可以在 2 个不同的 data.tables 之间执行此操作,那就更好了。(即 gp1 在它自己的 data.table 中,而 gp2 在另一个中)。

R 的长期用户,在 data.table 方面是菜鸟。

任何想法都会非常有帮助。

谢谢,肯

0 投票
0 回答
309 浏览

r - 直方图决定两个分布在 R 中是否具有相同的形状

我想在 R 中创建一个图表,如下所示(右),我可以在其中单独显示我的虚拟变量、预订 (1) 或步入 (0) 的分布。

这是为了正确分析 Mann-Whitney U 检验。

我想做正确的图表

我想做正确的图表

谁知道如何做到这一点?

0 投票
1 回答
78 浏览

r - R工作中未配对但未配对的ttest循环

我有一个循环,它遍历一个数据帧,运行 ttests 并将每个 ttest 的结果 p 值存储在另一个数据帧中。

这是循环,其中“mydata”是运行测试的数据帧。'mydata' 是一个有 4 列的数据框:

这是我对未配对(配对=假)测试的 mydf 输出:

但是,当我将paired=FALSE 更改为paired=TRUE(运行配对测试)时,这里是mydf:

我使用我的数据框的第一列,双括号中的“1”(对于paired = TRUE)单独检查了循环的这一行,它似乎正在输出一个p值:

以下是可用于重现错误的示例数据集:

您可以通过执行以下操作来导入它:

复制数据并将其粘贴到以下代码的引号中到 R 中:

现在,将数据分配给 data.frame:

我不知道为什么将“paired”参数更改为 TRUE 会导致这种情况发生。任何帮助/建议将不胜感激。谢谢 - 保罗

0 投票
0 回答
175 浏览

r - 在不使用 limma 的情况下进行多个 t 检验

我正在尝试进行配对 t 检验并为我拥有的一些甲基化数据生成结果 p 值。

数据分为 6 列:治疗前每位患者 3 列,治疗后每位患者 3 列。每个基因有一行(几千个),值范围为 [0,1]。

我想对每一行进行 t 检验,并最终为每个基因生成一个 p 值。在这个配对 t 检验中,您将在 [1,1] 中获得值,与 [1,4] 配对,[1,2] 与 [1,5] 配对,[1,3] 与 [1 ,6]。

我不想使用 limma 包,因为这不是严格的数组数据。您可以将 limma 用于非数组数据吗?

我将如何进行每个 t 检验并生成结果 p 值?

下面是我现在正在运行的内容,但是 R 返回“t.test.default(cg.t[i, c(1, 3, 5)], cg.t[i, c(2, 4, 6) 中的错误)]):没有足够的'x'观察"

请原谅我的天真,因为我在与 R 合作的第一年只是一名新手生物统计学家。感谢您的帮助。

0 投票
1 回答
764 浏览

r - 来自 R 中汇总数据的 1 个样本 t 检验

我可以使用 t.test 命令在 R 中执行 1 个样本 t 检验。这需要实际的数据集。我不能使用汇总统计数据(样本量、样本均值、标准差)。我可以使用 BSDA 包解决这个问题。但是在没有 BSDA 包装的情况下,还有其他方法可以在 R 中完成这个 1-sample-T 吗?