问题标签 [t-test]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R:使用 qt 函数计算 t 检验的 p 值
我们通过比较更新前后 10 个不同程序的性能来测试计算机的性能在其操作系统更新后是否增加,结果如下:
- 程序:#1 #2 #3 #4 #5
- 之前:34 29 32 27 28
- 之后:32 34 36 27 28
现在我们应该通过自己计算t并且只使用 R 中的qt 函数计算p 值来进行 t 检验。但是我必须如何使用 qt 函数来获取我的 p 值?
我计算了t,它是 -0,6486(R 中的 t.test 说 -0.64854 足够接近),df是 8
r - 多重 t 检验比较
我想知道如何使用t.test
或pairwise.t.test
在基因组合之间进行多重比较。首先,如何比较基因 1 与基因 3、基因 3 与基因 4 等的所有组合?其次,我如何才能只比较基因 1 与其他基因的组合?
我需要为此做一个功能吗?
假设我有下面的数据集,当“参数长度不同”时,我该怎么办?
谢谢。
r - R:每个因子水平内的行之间的 t 检验
这是我正在尝试处理的数据框:
我想知道如何在每个“类型”中的行之间执行 t 检验。这是我想要的 T1 类型的 t 检验示例:
我试图弄清楚如何遍历所有行并从 t 检验中获取所有 p 值(以及用于识别的类型和处理),而不是手动计算每一行。任何帮助或建议将不胜感激。
r - R:提高数据帧中每一行的 t 检验速度
我正在尝试提高数据帧的 t 检验循环的速度。
我有一个大数据框(~15000 行和 205 列)。每列是一个单元格,每一行是一个基因。我可以根据不同参考表中提供的标识将这些列分为 2 组。
这是我写的循环:
此循环要求我根据列标识将原始数据帧拆分为 2 个数据帧。然而,这个循环需要超过 45 分钟才能完成。
我想知道你们是否都对我可以做些什么有不同的建议?我如何潜在地使用应用功能来提高速度?
非常感谢!
r - 如何对数据子集进行 t 检验
首先,这个数据集在 t 检验中是不是很整齐?
https://i.stack.imgur.com/tMK6R.png
其次,我正在尝试进行双样本 t 检验,以比较治疗 a 和 b 的时间 3 的“结果 1”的平均值。我该怎么做呢?
样本数据:
class - proc ttest 类,默认组问题
我想使用 比较两组的平均值proc ttest
,我成功地做到了如下。
但是,此代码仅假设观察结果group = 0
为默认组。因此,t-statistics
根据Mean
(组 = 0 的 obs 得分)减去平均值(组 = 1 的 obs 得分)来计算。但是,我想反其道而行之。
它只会改变 的符号t-statistics
,但这正是我想做的。
是否可以通过简单地添加选项来执行此操作?
我知道如果我创建了另一个与我的组变量完全相反的虚拟变量,我可以做到这一点。但是,我不想创建更多的虚拟变量。
r - R中的中位数分裂
我如何在 R 中进行中位数分割?我有一个来自 SPSS 的数据集 [1:130],其中包含 7 个不同的分量表,我需要对其进行适当的中位数分割。2 高于中位数,1 低于中位数。我一直试图弄清楚如何使用 R 来做到这一点,因为我无法立即访问 SPSS,但我发现没有任何效果。任何人都可以给我任何关于如何做到这一点的提示吗?
我正在尝试使用中位数分割,将数据记录为高(2)或低(1),以便使用独立的 t 检验来检验显着性。
我尝试使用此处找到的代码:如何在 R 中的因子水平内进行中位数分割?
但结果不允许我在测试中使用它们。
适用代码:
产生的错误:
model.frame.default 中的错误(公式 = alldata$npumps_a ~ alldata$nsss_dis):变量“alldata$npumps_a”的类型无效(NULL)
p-value - 我的 p 值太低 (p<<0.01)
我知道通常较低的 P 值是好的,因为我想拒绝 H0 假设。但是我的问题很奇怪,如果您能给我任何帮助或见解,我将不胜感激。
我使用庞大的数据集(n>1,000,000),每个代表一年的数据。我需要分析数据并找出当年的平均值是否与上一年的平均值有 显着 差异。然而,每个人都希望它不重要而不是重要。
在“显着”中,我的意思是我希望能够告诉我的老板——“看,那些不显着的变化是噪音,而那些显着的变化代表着真正需要考虑的事情”。
问题在于,简单地将两个平均值与 T 检验进行比较总是会导致显着差异,即使差异非常非常小(可能是由于样本量大)并且落在现实的 OK 区域内。所以基本上按照我的看法,P 值不能很好地满足我的需求。
你觉得我应该怎么做?
python - 如何在 python 中计算(统计)幂函数与样本大小?
这怎么能在python中完成?
- 计算给定功率和 alpha 的样本量?
- 计算给定样本大小和 alpha 的功效?
注意: 我对 python 为(统计)幂函数计算提供的函数完全感到困惑 :(。
有人可以帮我在这里下订单吗?
statsmodels下有两个函数:
我们有:
我们还有:
还有这段代码:
我在某个地方找到了这个例子,但它没有解释什么是 prop1 和 prop2!
每一个都给了我不同的价值观。
谢谢
matlab - Matlab中的`ttest`和`ttest2`函数有什么区别
我有两个样本 X 和 Y,都是 N*1 向量,我发现在 Matlab(R2015) 中,两者都ttest
可以ttest2
接受两个样本并给出 P 值,但它们的结果有些不同。
对于ttest
,ttest(X,Y) 给出 P = 1.8e-7,对于ttest2
,ttest2(X,Y) 给出 P = 8.0e-11。似乎这两个函数都给出了相对较低的 P 值。但是,我不熟悉这两个函数之间的区别,另外,如果我要报告 P 值,我应该选择哪个值?