问题标签 [hypothesis-test]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
19623 浏览

r - 来自 N/Mean/SD 的 R T 检验

我知道如果我有一组数据,我可以跑来t.test做 T 检验。但我只知道每组的计数、平均值和标准差。我确信在 R 中必须有一种方法可以做到这一点,但我无法弄清楚。有什么帮助吗?

0 投票
3 回答
1686 浏览

r - 快速 perl t 检验函数

我正在使用 perl+R 来分析大量样本数据集。对于每两个样本,我计算 t 检验 p 值。目前,我正在使用 statistics::R 模块将值从 perl 导出到 R,然后使用 t.test 函数。然而,这个过程非常缓慢。我想知道是否有人知道以更有效的方式执行相同过程的 perl 函数。

谢谢!

0 投票
4 回答
4442 浏览

r - 配对 t 检验崩溃应用循环(已编辑)

为了回应有用的评论,我编辑了原始问题(我曾假设 for-loop 和 apply-loop 给出不同的结果)。

我正在使用 R 运行大量 2 组 t 检验,使用来自分隔表的输入。根据这里和其他地方的建议,我尝试了“for-loops”和“apply”来实现这一点。对于“正常”的 t.test,两者都可以很好地工作并给出相同的结果。但是,对于配对 t 检验,for-look 似乎有效,而 apply-loop 则无效。后来,我发现两个循环都遇到了同样的问题(见下文),但是 for 循环更优雅地处理了这种情况(只有一个循环循环返回无效结果),而 apply 循环完全失败。

我的输入文件如下所示:(第一行是标题行,数据行有一个名称,第 1 组有 4 个数据点,第 2 组有 4 个数据点):

依此类推(总共约 50000 行)。第一条数据线(以name19开头,原来是罪魁祸首。

这是效果更好的 for 循环版本(在有问题的行上失败,但正确处理所有其他行):

这是导致问题的“应用”版本

大约 50000 条数据线中的一条是有问题的,因为所有成对比较的差异都是相同的,这在成对的 t 检验中会导致未定义的 p 值(基本上为零)。应用循环因错误“数据基本不变”而崩溃。对我(作为一个 R 新手)来说,仅仅因为 t.test 不喜欢一个数据而使整个脚本崩溃似乎不是一个好主意。在 for 循环中,该数据行也会导致错误消息,但循环继续,所有其他 t 检验给出正确的结果。

我做错了什么吗?这种行为本质上禁止使用应用循环进行这种批处理分析。或者有没有一种标准的方法来规避这个问题。为什么 t 检验不只是返回对该特定 p 值无效的东西而不是退出?

0 投票
2 回答
6691 浏览

r - 将 t.test 应用于大型矩阵的每一列的最快方法是什么?

假设我有一个大矩阵:

进一步假设每一列代表一个样本。假设我想申请t.test()每一列,有没有比使用快得多的方法apply()

在我的电脑上运行分析只用了不到 2 分钟:

0 投票
3 回答
129000 浏览

python - Pandas 中的 T 检验

如果我想计算 Pandas 中两个类别的平均值,我可以这样做:

我有很多以这种方式格式化的数据,现在我需要做一个T检验,看看cat1cat2的平均值是否在统计上不同。我怎样才能做到这一点?

0 投票
5 回答
20621 浏览

r - 如何编写循环来运行数据框的 t 检验?

我遇到了对存储在数据框中的某些数据进行 t 检验的问题。我知道如何一一做,但一点效率都没有。请问如何写一个循环来做到这一点?

例如,我在testData中得到了数据:

我需要对具有两个独立组的每一列运行 t 检验,即“好”与“坏”的几个特征“F1”到“F11”。我试图做类似的事情:

然后做剩下的“F2”到“F11”,但显然效率不高。如果您有更好的想法来循环运行它,我真的很感激。非常感谢。

0 投票
1 回答
409 浏览

matlab - 进化算法比较中的 T 检验

我已经实现了 2 个进化算法。并运行它们中的每一个进行 100 次试验。

我保存了每次试验的最终最佳适应度值。

如何使用 T-Test 将每个算法的最终平均适应度与 matlab 进行比较?

我想看看算法性能是否有显着差异?

0 投票
1 回答
316 浏览

python - Python 仅对对执行 t 检验

嗨,不久前我得到了帮助来实现这个功能,但我现在被卡住了。

查找 list1 和 list2 中的所有单词

正如人们所看到的,我试图比较两个包含单词频率的列表,但是有些单词并没有出现在两个样本大小中。我希望对每个单词对进行 t 检验,以确定它们的方差。但是,这一遍又一遍地给了我相同的 t 值和 p 值对。

有人有什么想法吗?

示例文件如下所示:count-pos.txt

0 投票
3 回答
24650 浏览

r - t 检验错误

我在正常的 t 检验中遇到错误:

错误:

我无法理解向量出了什么问题。你能告诉我吗?我一直无法弄清楚。

0 投票
2 回答
273 浏览

r - 在 R 中实现的配对 t 检验的研究论文

我已经使用配对 t 检验来使用我的 R 数据验证假设。是否有任何与 R 中的 t 检验相关的研究文章?

如果有任何与 R 中的 t 检验相关的文章,请告诉我。