问题标签 [p-value]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
6 回答
84178 浏览

r - 使用 p 值逐步回归以删除 p 值不显着的变量

我想使用p 值作为选择标准执行逐步线性回归,例如:在每个步骤中删除具有最高即最不显着 p 值的变量,当所有值都由某个阈值alpha定义时停止。

我完全知道我应该使用 AIC(例如 command stepstepAIC)或其他一些标准,但我的老板没有掌握统计数据并坚持使用 p 值。

如有必要,我可以编写自己的例程,但我想知道是否有已经实现的版本。

0 投票
1 回答
438 浏览

r - 比较两个向量的 FDR

我们得到一个包含 2 列(样本、实验条件)和n行(例如基因)的矩阵,我们的目标是识别两个样本之间(在特定 FDR 处)发生显着变化的基因。

如何使用 R 执行此操作?

下面是fdrtool包手册中的一个示例,它显示了如何从 p 值向量计算 FDR:

但问题是我们这里只有两个观察向量,而不是 p 值。有任何想法吗?

这是可以使用的示例数据:foo <- matrix(runif(1000), ncol=2)

我假设我们没有重复信息、p 值等。但可以肯定的是,两个样本之间值相差很大的基因肯定有更强有力的证据。在这种情况下有没有办法分配 FDR?

0 投票
5 回答
120501 浏览

r - 在 ggplot 条形图和箱线图上加上星号 - 表示显着性水平(p 值)

通常在条形图或箱线图上加上星号以显示一组或两组之间的显着性水平(p 值),以下是几个示例:

在此处输入图像描述在此处输入图像描述在此处输入图像描述

星数由 p 值定义,例如,p 值 < 0.001 可以打 3 星,p 值 < 0.01 可以打 2 星,依此类推(尽管从一篇文章到另一篇文章有​​所不同)。

还有我的问题:如何生成类似的图表?根据显着性级别自动放置星星的方法非常受欢迎。

0 投票
1 回答
7109 浏览

r - glm 模型的一个 p 值

我正在寻找一种方法来获得一个描述 glm 模型拟合优度的 p 值。以下是手册页中稍作修改的示例lm

summary(lm.D9)一个得到

如果 id 对 glm 做同样的事情

我明白了

lm有 F 统计量作为整个模型的总结,glm没有。那么问题又来了:如何从描述拟合的 glm 模型中获得一个 p 值?

谢谢

0 投票
2 回答
1642 浏览

r - 在舍入为 0 之前,R 将呈现的最小数字是多少?

我正在使用 R 软件(自举 Kolmogorov-Smirnov 测试)对非常大的数据集进行一些统计分析,这意味着我的 p 值都非常小。我已经对我执行的大量测试进行了 Bonferroni 校正,这意味着我的 alpha 值也非常小,以拒绝零假设。

问题是,在某些情况下,R 给我的 p 值为 0,其中 p 值可能太小以至于无法呈现(这些通常用于非常大的样本量)。虽然我可以很高兴地拒绝这些测试的零假设,但数据是为了发布,所以我需要写 p < ..... 但我不知道 R 中的最低可报告值是多少?

我正在使用该ks.boot功能以防万一。

任何帮助将非常感激!

0 投票
2 回答
5749 浏览

r - R中的P值问题

我有一个关于 p 值的问题。我一直在比较不同的线性模型,以确定一个模型是否比 R 中的以下函数更好。

不幸的是,有时它不会计算 F 或 p 值。这是一个没有给出 p 值的方差分析摘要的示例

为了对称起见,这里还有一个确实产生了 p 值的 anova 总结。

你知道为什么会这样吗?

0 投票
0 回答
778 浏览

r - Kruskal Wallis 检验的 p 值不正确;可能与NA值有关?

当我看到这一点时,我试图在数据框中的两列之间执行 Kruskal-Wallis 测试,如果我将一列与其自身进行比较,我不会得到 1 的 p 值:

如果我比较两个包含相同数据的不同列,也会发生同样的事情:

我认为这是由于列中的 NA 值,所以我尝试了一个简单的示例:

谁能告诉我我做错了什么?

0 投票
1 回答
5090 浏览

r - 使用 R 计算维恩图超几何 p 值

嗨,我看到有人计算维恩图重叠 p 值,如下例所示。他们使用超几何分布和 R。当我在 R 中应用他们的函数时,我无法得到相同的结果。谁能帮我解决这个问题?

我在别人的出版物中看到的样本:

从15220个基因中,A组是1850+195个基因,B组是195+596个基因,重叠是195个基因。它们的 p 值为 2e-26。

他们的方法是:给定总共N个基因,如果基因集A和B分别包含m和n个基因,并且其中k个是共同的,那么富集的p值计算如下:

for ifrom kto min(m,n),其中“ (m,i)”代表二项式。

我使用 R 的方式是:

sum(choose(596+195,195:(195+596))*choose(15220-596-195,(1850+195)-195:(195+596)))/choose(15220,1850+195).

我得到了NaN

或使用:phyper(195,1850+195,15220-1850-195,596+195),我得到了 1。

我也参考链接http://www.pangloss.com/wiki/VennSignificance 但是当我计算

1 - phyper(448,1000,13800,2872)在 R 中,我得到了 0 而不是 1.906314e-81 的链接。

我对 R 和统计完全陌生,很抱歉在这里发布了许多错误。

0 投票
1 回答
1058 浏览

r - boot() 在替换时产生错误 - R

我编写了几个函数来从 lm 对象中检索统计数据(系数和 p 值),以供引导。系数一起作用;p 值失败并出现错误:

我现在认为该错误与包含因子变量有关。试图用易于重现的数据重现问题。

在我的初学者眼中,从每个返回的类“数字”值似乎具有完全相同的格式......但我猜不是吗?在运行下一个函数之前,我还清除了返回的 bt bootstrap 对象,但这并没有解决它。我怎样才能最好地检索自举 p 值?感谢您的任何想法。(在 Mac OSX 上运行 R 3.0.1。)

0 投票
2 回答
2095 浏览

r - 与替换长度和数据或数据类型相关的 boot() 错误?-R

boot() 在一个数据集上失败并在另一个数据集上成功......一定是数据问题吗?我只是无法弄清楚区别。但至少现在我认为我已经得到了它的重现性。在这两种情况下,整数和因子变量之间的交互作用都会回归 (lm) 到数值因变量上。boot() 命令失败并出现以下错误:

我返回 p 值的统计函数是:

当我生成随机数据以便在此处重现和发布问题时,如下所示:

然后引导:

引导工作;没有错误;生成的统计数据。但是对于我自己的数据(如下),相同类型的,boot() 返回错误。

线性模型可以单独使用这些数据运行良好。traceback() 除了启动调用之外什么都不产生。请,欢迎任何想法。我在 MAC OSX 上使用 R 3.0.1。谢谢!