问题标签 [t-test]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
72 浏览

r - 如何表示二进制 t 统计量?

问题是这样给出的:

阅读文件糖尿病.csv。有两个变量称为 BMI 和 Outcome。变量 Outcome 仅取两个值:0 和 1。对两个 Outcome 值的 BMI 标准差相同的假设进行非参数双样本检验

数据在一些称为“糖尿病”的数据集中。我的问题是如何表示“t 统计量”,因为结果是二元的?

0 投票
2 回答
2471 浏览

python - How to interpret the upper/lower bound of a datapoint with confidence intervals?

Given a list of values:

Using student t-test, I can find the confidence interval of the distribution at the mean with an alpha of 0.1 (i.e. at 90% confidence) with:

[out]:

But if I were to find the confidence interval at every datapoint, e.g. for the value 10:

How should the interval of the values be interpreted? Is it statistically/mathematical sound to interpret that at all?

Does it goes something like:

At 90% confidence, we know that the data point 10 falls in the interval (9.6345012890050086, 10.365498710994991),

aka.

At 90% confidence, we can say that the data point falls at 10 +- 0.365...

So can we interpret the interval as some sort of a box plot of the datapoint?

0 投票
1 回答
3853 浏览

r - R中的显着性检验

我正在尝试确定两个接口之间是否存在显着差异。我有一个如下所示的文本文件:

现在我需要找出在执行此操作时应该使用哪种方法。到目前为止,我已经尝试了韦尔奇的两个样本 T 检验方法,我认为这是正确的。但这是确定是否存在意义的正确方法吗?顺便说一句,显着性水平为 5%。

这是我的代码:

p 值的输出是:0.2586,大于0.05,这应该意味着没有意义,对吧?还是我做错了什么?我是R的初学者。

0 投票
1 回答
281 浏览

python-3.x - 根据 Pandas 中的系列成员资格创建两个数据框

我是初学者,我似乎无法找到确切的答案。

我有两个数据框,第一个有本地化的经济数据(df1):

第二个有一个州和地区列表,(df2):

最终,我想要做的是在州和地区之间t-test的列上运行 a与所有其他不包括在. 但是,我还没有设法划分组,所以我无法运行测试。Diffdf2df1df2

我最近的尝试(很多)看起来像这样:

我也尝试pd.merge过,但似乎无法正常工作。我认为这是因为多级索引,但我仍然不知道如何获取不在df2.

0 投票
1 回答
1448 浏览

r - 用于特征选择的 t-stat

我想用 for 循环计算 R 中特征选择的 t-Statistic。数据有 155 列,因变量是二进制的(诱变剂 - 非诱变剂)。我想为每一列分配一个 t-stat。问题是我不知道怎么写。

这是我试图在 R 中实现的公式:

在此处输入图像描述

我也写了一个代码,但我不确定它只是第一列。我需要将它写在所有列的 for 循环中。

提前致谢!

0 投票
1 回答
1140 浏览

python - R和Python之间的不同t检验p值

我目前是 python 新手,正在尝试了解有关倾向得分匹配的更多信息。我从 Stanford.edu 找到了一个很棒的教程(因为这是我的第一个帖子堆栈溢出不会让我发布两个链接,但谷歌斯坦福倾向得分匹配)涵盖了这一点。我的目标是在 python 中重新创建这一切并了解正在发生的事情。

我的问题是当我到达第 1.2 节差异均值:预处理协变量并开始运行 t 检验时。我不明白为什么对于相同的测试和相同的数据,R 和 Python 之间的 p 值如此不同。

代码: with(ecls, t.test(race_white ~ catholic, var.equal=FALSE))

输出:

当我在 python 中执行相同的想法时,我的 t-stat 和自由度是相同的,但我的 p 值相差很远。

Python代码:

蟒蛇输出: (-13.45342570302274, 1.1413329198468439e-39, 2143.2902027156415) The t-statistic is -13.453 the p-value is 0.000 and the df is 2143.290'

我使用的是完全相同的数据集,只是无法弄清楚为什么两者不同。我在另一个类似的 SO 主题中看到,但他们的结论是大小不同。这是使用相同的数据集,因此大小没有不同。

可以在此处找到用于 python 和 R 的数据文件(ecls.csv)的数据文件。非常感谢任何关于为什么此 t 检验的 p 值不同的帮助。

0 投票
1 回答
344 浏览

javascript - 在 javascript 中实现 2 尾 t 分布 - 修改现有解决方案

我正在尝试在 javascript 中实现双尾 t 检验。

来自:Google 电子表格的 JavaScript 中的学生 t 分布

我从链接中提取了一个潜在的解决方案并将其修改为在表单之外工作:

这似乎没有提供双尾测试。有没有办法修改它以使其成为双尾?

0 投票
1 回答
4117 浏览

python - 如何对存储在 pandas DataFrame 中的数据执行 t 检验

我有一些实验数据。该实验随时间测量了三种不同细胞系中的 126 个基因,其n=6. 标准化的测量值称为delta_ct值。数据存储在pandas.DataFrame如下所示:

请注意,我将创建索引的列保留为列,因为它使绘图seaborn更容易一些。我的问题是,我将如何进行 t 检验来检验不同细胞系之间每个时间点的平均值彼此显着不同的假设。

例如,在上面的数据中,我想对df.loc[['Adult',0]]和进行 t 检验df.loc[['Neonatal',0]],即相同的时间点但不同的细胞系。

0 投票
0 回答
190 浏览

r - 需要遍历列来执行 t 检验?

所以我有一个客户调查,我需要确定这四个领域之间是否存在显着差异。我显然想对这些进行 t 检验,这是我目前的 R 解决方案。

(编辑)我想出了嵌套循环,但我仍然认为有一种比这整个两个列表更快的方法来做我想做的事,嵌套循环废话。我的输出也没有名字,所以我不知道要比较什么,它包括所有重复的逆比较。我也无法保存结果。我认为我的解决方案肯定在别处。

此外,产生如此多的 t 检验 p 值甚至是实现我想要的最佳统计方法吗?似乎应该有比这更容易的事情......

0 投票
1 回答
2449 浏览

python - 线性回归的单边 t 检验?

我有这个问题。我正在尝试进行线性回归并测试斜率。t 检验检查斜率是否远离 0。斜率可以是负数或正数。我只对负斜率感兴趣。

在这个例子中,斜率是正的,我不感兴趣,所以 P 值应该很大。但它很小,因为现在它测试斜率是否在任一方向上远离 0。(我强制截距为零,这是我想要的)。有人可以帮我看看斜率是否只是负数。在这种情况下,P 值应该很大。

我该如何更改为 99% 置信水平或 95% 或...?