问题标签 [t-test]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
389 浏览

r - 如何否定子集参数

我正在编写一个在数据帧上进行测试的函数,根据我定义的参数对数据进行子集化。这是一个使用 mtcars 数据的工作示例:

下面是实际运行的函数,比较具有 3 个齿轮的汽车与具有 4 个齿轮的汽车,查看具有 2 到 4 个化油器的自动 (am=0) 汽车:

请注意,我将参数的默认值定义为“FALSE”。我想要的是为这些参数找到一个自动否定子集的默认值,这意味着所有值都包括在内。我自己最好的解决方案是在函数开头为每个参数添加 if() 子句,如下所示:

一旦参数数量增加,这将变得难以管理。是否有一个默认值可以设置我的参数,这将否定子集?

我想象一些与 NULL 对象等价的东西:“非 NULL”,或简单地等于一切的通配符对象。如果不是,我可以修改我的代码以在子集步骤中使用 NULL 对象吗?

使用关键字“all”、“any”和“subset”进行搜索通常会链接到引用函数 all() 和 any() 的页面,但并没有让我进一步了解。我会很感激任何帮助,谢谢。

0 投票
1 回答
534 浏览

r - 如何一次做多个 t.test()

我有两个数据集。

每个数据集都有很多相同物种的列,在两个不同的场合采样。

现在我想看看物种的平均值是否彼此显着不同。我了解到我必须为此进行配对 t 检验。

我想出这样做的公式是:

Q1:我是否使用正确的函数进行配对 t 检验?

Q2:鉴于我实际上做得正确。我如何解释答案?. t= 告诉我什么?p 值低,这是否意味着物种的平均值相似或不相似?

Q3:有没有办法让 R 自动比较两个数据集中的所有相同物种,还是我必须手动进行?

0 投票
0 回答
82 浏览

r - 对来自具有不同自变量的两个不同模型的系数进行 t 检验

我想检查两个变量之间是否存在替代效应。

在我估计的模型中,这些已被设置为自变量。每个模型都有一个“主要”因变量和一系列控制变量。

我想进行 t 检验来比较每个模型的系数。这样,基于 p 值,我可以假设我不是在说苹果和橙子,即使我无法计算这种替代效应的大小,我至少可以证明它存在。

问题是我不知道如何在 R 中对系数执行 t.test。

0 投票
1 回答
813 浏览

pandas - 在两个熊猫系列上应用 ttest_ind 时 t-stats 值的意义是什么?

当 ttest_ind 应用于两个独立的序列时,可以从得到的 t-stats 值得出什么结论?

0 投票
2 回答
392 浏览

r - 在两个列表中包含的 data.frames 之间执行学生 t 检验

我有两个单独的列表,每个列表包含 4 个 data.frame。我需要在两个列表中的每个 data.frames 之间执行学生 t 检验( t.test) 。rainfall

这里的列表:

我需要做的是:

我可以通过编写 4 个 data.frame 中的每一个来做到这一点(我实际上有 40 个带有我的真实数据),但我想知道是否存在更智能、更快捷的方法来做到这一点。

下面是我尝试过的(没有成功):

0 投票
2 回答
264 浏览

r - R t.test() 以 data.frames 作为参数

CrossValidated 上有一个问题,有人给t.test函数提供了两个数据帧而不是两个向量:https ://stats.stackexchange.com/questions/261830/t-test-or-wilcox-in-r-and-how-应用到数据框拆分成 2 组/

请参阅此代码以获取更短的示例

该函数的help页面t.test明确指出 x 和 y 应该是

数据值的(非空)数字向量。

上面的代码仍然没有抛出错误,但给出了结果。结果的意义是什么?

0 投票
0 回答
606 浏览

r - R中t检验的错误消息

当我尝试在 R 中运行 t 检验时收到以下错误消息:

我的数据集很大(约 3000 行),但感兴趣的列中的前几行是:

对于第二个:

从之前关于这个主题的问题来看,问题似乎通常是数据中存在非数字元素;但是,这里似乎并非如此。我已经取出了所有的 NA;剩下的应该只是数字。

该数据涉及特定物种;我对其他 3 个数据框设置相同的物种进行了 t 检验,我没有遇到任何问题,所以......我很难过。

0 投票
1 回答
341 浏览

pandas - 按组分组到熊猫系列/数据框

如果这个问题很幼稚,请提前道歉。我是 Python 新手。我正在尝试对我的数据框的两列执行 t 检验。只有在将列按同一数据框中的另一列分组后进行 t 检验才有意义。

我正在处理这样的事情:

我得到的输出是:

然后,我按 key1 分组

我想对基本上 0: Int64Index([0, 1, 3, 7], dtype='int64') vs 1: Int64Index([2, 4, 5, 6, 8], dtype=' int64')。

这可能吗?

谢谢!

0 投票
0 回答
426 浏览

python-3.x - CSV 导入到 t 检验

我有一个 .csv 文件,其中包含需要对其进行双尾 t 检验的特定列。这是我的 .csv 文件的示例:

我需要将两种类型(A 和 B)分配给 t 检验的不同变量。更具体地说,我需要一个 for 循环(我假设),它将使用文件中所有 A 类型的 No. 值并进行双尾 t 检验,比较 A 类型和 B 类型的 No. 值。然后,我需要对所有 A 类型和 B 类型的 Count 值进行另一个双尾 t 检验。我一直在看熊猫,这似乎对排序 .csv 文件很有用。我用它做了一个看起来像这样的测试:

这会产生正确的结果。但是,当我尝试使用 scipy-lectures 中的示例进行双尾 t 检验时,我得到了 NAN 结果。这是代码:

当它运行时,我收到以下消息:

我不知道为什么这会获得 nan 值,并且无法理解如何解决这个问题。谢谢!

0 投票
2 回答
14469 浏览

r - 基于组/类别执行多个配对 t 检验

我坚持在 Rstudio 中为多个类别执行 t.tests。我想得到每种产品类型的 t.test 的结果,比较线上和线下的价格。我有超过 800 种产品类型,这就是为什么不想为每个产品组手动操作的原因。

我有一个名为 data 的数据框(超过 200 万行),如下所示:

理想情况下,我希望 R 将 t.test 的结果写入另一个名为 product_types 的数据框:

变成:

如果我在不同的数据框中拥有所有产品类型,这就是公式:

必须有一种更简单的方法来做到这一点。否则我需要制作 800+ 个数据帧,然后执行 t 检验 800 次。

我尝试了列表和 lapply 的东西,但到目前为止它不起作用。我还在多个列上尝试了 t-Test: https ://sebastiansauer.github.io/multiple-t-tests-with-dplyr/

但是,最后他仍然手动插入男性和女性(对我来说超过 800 个类别)。