问题标签 [p-value]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Mann-Whitney-U 检验
我有一个包含数千个样本的csv,应该比较不同处理后的基因表达:
我被要求做一个Mann Whitney u 测试,当我使用这个时,R 给了我结果:
但是,我只得到 0.1 或 0.5 之类的值。
当我添加时,alternative ="greater"
我得到了 0.35000 或 0.05000 之类的值,一些样本得到了 0.14314 之类的 pvalue(这是我可以接受的值)。所以我想知道为什么 R 给了我这么奇怪的 pvalues (0.35000,..) 以及如何修复它以获得“正常”pvalues。
r - 对于 R 中的小 p 值,Z 分数四舍五入到无穷大
我正在使用一个全基因组关联研究数据集,p 值范围从 1E-30 到 1。我有一个 R 数据框“数据”,其中包括一个用于 p 值的变量“p”。
我需要使用以下代码对 p 值进行基因组校正:
在第二行的命令中,我使用 qchisq 函数将 p 值转换为 z 分数,p 值 < 1E-16 的 z 分数被四舍五入为无穷大。这意味着我最重要的数据点的 p 值在基因组校正后四舍五入为 0,我失去了它们的排名。
有没有办法解决?
predict - nlm p 值和置信区间之间的差异
我有一个数据集,我使用来自 41 个人的 10 个估计器来估计家庭范围大小。我想测试这些估计量是否彼此显着不同,因此我使用 nlme 拟合线性混合效应模型,如下所示:
Size 是家庭范围大小(对数进行转换以满足正态性假设),band 是代表我的 10 个估计量的 10 个级别的因子,nobsS 是采样强度的度量(按采样天数标准化的各个位置的数量),Sex 是男性/female,而snake是我个人的随机效果。总结输出如下:
p 值表明几个水平与参考水平显着不同,并且模式与我根据原始数据预期的一致。但是,我想显示具有 95% 置信区间(不是预测区间)的平均对数(家庭范围大小),以比较不同估计器之间的效果大小。为此,我使用 predict.lme 函数和 SE 使用来自先前 R 线程的代码计算了预测值: https ://stat.ethz.ch/pipermail/r-sig-mixed-models/2010q1/003320.html 但是,我的 95% CI 广泛重叠,比我根据我的 lme 模型的 p 值预期的要多得多。我复制了我获得的值,这些值显示了 95% CI 的广泛重叠:
有没有人建议为什么 p 值在估计水平之间显示出显着差异但 CI 重叠?我很抱歉没有提供任何数据,但如果有帮助,我很乐意通过电子邮件发送我的原始数据和完整代码的副本。
谢谢,JBauder
r - R中的箱线图比较-如何在箱线图中以垂直线显示p值?
我生成了一个箱线图并测试了向量 x1 和 x2 与wilcox.test
. 如何在箱线图中实现测试结果?
感谢你们!
R版3.1.0(2014-04-10)——《春之舞》
平台:x86_64-w64-mingw32/x64(64位),Windows 7
r - 在表格中呈现 Tukey HSD 成对 p 值
我正在对我的数据运行一个 posthoc Tukey HSD,它有十个因子水平。该表很大,我希望仅以成对表的形式向读者展示 p 值,将 45 行表留作附录。
这是一个示例数据集:
结果是一个 45 行的表。相反,我想要一个表格,其中因子级别作为行和列名称,单元格中的 p 值显示两者是否有显着差异。Xs 或下划线或任何可能表示重复或不必要的比较。像这样的东西:
等等。
有没有办法自动生成这样的表格?
r - 使用R依次找到几个Fisher精确检验p值
我有超过5000个数据集,我想找到在 R 中使用 Fisher 精确测试的 p 值。它们保存在csv文件中,看起来像这样;
其中每一行代表一个列联表。现在,我不得不一次做一张应急表,这将花费我很长时间。
到目前为止,我使用此代码 alltables<-read.table("untitled1.csv") ##读取我的数据 apply(alltables,1, function(x) fisher.test(matrix(x,nr=2))$p 。价值)
但随后我收到错误“fisher.test 中的错误(矩阵(x,nr = 2)):'x' 必须至少有 2 行和列”
p-value - 使用 lmerTest 无法获得 lmer 的 p 值
我已经使用lmerTest
和 using运行了以下模型lme4
:
使用我在输入命令lmerTest
时收到以下错误:summary()
我看到这对其他用户来说已经是一个问题,并且一个用户能够绕过运行的问题lsmeans()
。当我尝试 lsmeans 时,我得到了错误:
查看协方差矩阵时,我没有看到任何 NA。请注意,如果我简单地反转组因子中的对比,我就可以运行这个模型。我很难理解为什么会这样。
当我使用 lme4 而不是 lmerTest 运行相同的模型时,我能够获得 summary() 的所有输出,但没有 p 值(如预期的那样)。pvals.fnc 在 lme4 中已停产,我还没有找到替代方案。另外,最好以与我成功使用 lmerTest 的其他模型相同的方式估计模型 2 的 p 值。
有谁知道我此时应该做什么?任何帮助将非常感激!
python - 在python中获取相关系数的统计差异
为了获得python 中两个数组之间的相关性,我使用:
但是,如文档中所述,从返回的 p 值pearsonr()
仅对大于 500 的数据集有意义。那么我怎样才能获得对小数据集合理的 p 值?
我的临时解决方案:
在阅读了线性回归之后,我想出了自己的小脚本,它基本上使用Fischer 变换来获得 z 分数,从中计算 p 值:
有用。但是,我不确定 给出的 p 值是否更合理pearsonr()
。是否有已经具有此功能的 python 模块?我无法在SciPy或Statsmodels中找到它。
编辑以澄清:
我的示例中的数据集已简化。我的真实数据集是两个包含 10-50 个值的数组。
python - python和R中卡方检验的不同p值
作为一个普通的 R 用户,我正在学习使用 python 进行分析,我从卡方开始并做了以下工作:
R
Python
对于test1
,我很满意,因为 python 和 R 的测试结果相似,但test2
事实并非如此,因为 R 有参数correct
,所以我将其从默认值更改,生成的 p 值不一样。
我的代码有什么问题吗?我应该“相信”哪一个?
更新01
感谢您的反馈。我知道卡方检验不应该用于值小于 5 的单元格,我应该使用 Fisher 精确检验,我担心的是为什么 R 和 Python 给出的 p 值差异如此之大。
r - 按 p 值切割 rcorr 表
我用rcorr
24 来关联 54 个项目。
别担心,我知道这是很多相关性,可能需要执行额外的统计来解决这个问题。这主要是为了了解我的数据。
使用rcorr
我想将生成的表减少到仅低于 0.05 的 p 值。我对与此相关的项目不感兴趣。该命令会是什么样子?现在这是我正在使用的命令
我还运行了所有项目的 PCA 以查看它们如何一起加载,但我也想查看相关性。