0 投票

1 回答

1020 浏览

r - 使用 R 和 ddply 的“超过 30 对时的相关性和意义”

我在这里找到了我的问题的部分解决方案：如何计算 R 中的相关性

除了cor（计算 Pearsons r）之外，我还计算cor.test（对于 p 值）。但是在“没有足够的有限观察”的情况下这会失败，所以当一些 ID 是单独的时，在我的情况下它们经常出现。

因此，只有当数据对超过 30 对时，我才需要计算 r，如果更少，我想要 NA。

第二个问题是冗长的输出cor.test夸大了结果数据框——即使我唯一想要的就是 p 值。也就是说，如果 p 实际上是，我理解它是什么。是r的意义吗？

我只知道 t 检验，来计算 r 的显着性。

{t-test-value的公式：t = (r·(n-2)^0.5)/(1-r^2)^0.5)-但t还不是意义，否则我会尝试将公式实现到ddply语句中}

2012-03-15T13:45:30.500

0 投票

1 回答

1760 浏览

r - 如何在 R 中进行特定的成对比较

我有一些我继承的代码，它为预测均值的成对比较生成一个显着性水平矩阵。由于该模型包括来自多个站点和治疗的数据，但我只想在一个站点内的治疗中比较基因型，因此只有一部分比较是有意义的。

这是当前生成的虚拟版本。

显然，在这种情况下，T/F 是随机的。我想要的是只看到一个站点和治疗中的比较。最好也删除自我比较。理想情况下，我想以以下形式返回数据框：

我做了一些错误的开始，如果有人在正确的方向上有一些快速的指示，将不胜感激。

在下面 Chase 给出的非常有用的答案中，您可以看到虽然无意义的比较已被删除，但每个有用的比较都包含两次（基因型 1 与基因型 2，反之亦然）。我看不出如何轻松删除这些，因为它们并不是真正的重复......

- 更新 -

抱歉，我需要进行更改mat，以便在实施 Chase 的解决方案时，Genotype1并且在我的实际情况下Genotype2是factor，不是。int我在下面给出的解决方案中添加了一些内容（添加一个排序列以避免重复比较）。

它有效，这很好，但添加这些列对我来说似乎很尴尬 - 有没有更优雅的方式？

r comparison significance

2012-05-08T04:11:12.940

0 投票

3 回答

21052 浏览

r - 使用 ggplot2 将显着性级别添加到矩阵相关热图

我想知道如何在矩阵相关热图中添加另一层重要且需要的复杂性，例如除了 R2 值（-1 到 1）之外的显着性水平星的方式之后的 p 值？
在这个问题中，不打算将显着性水平星或 p 值作为文本放在矩阵的每个正方形上，而是在矩阵的每个正方形上以显着性水平的开箱即用图形表示形式显示这一点。我认为只有那些享受创新思维祝福的人才能赢得掌声来解开这种解决方案，以便有最好的方式来表示我们的“半真半真矩阵相关热图”中增加的复杂性组件。我用谷歌搜索了很多，但从未见过合适的，或者我会说一种“眼睛友好”的方式来表示显着性水平加上反映 R 系数的标准色调。
可重现的数据集在这里找到：http:
//learnr.wordpress.com/2010/01/26/ggplot2-quick-heatmap-plotting/
R代码请在下面找到：

矩阵相关热图应如下所示：
在此处输入图像描述

增强解决方案的提示和想法：
- 此代码可能有助于了解从本网站获取的显着性水平星：http:
//ohiodata.blogspot.de/2012/06/correlation-tables-in-r- flagged-with.html
R 代码：

- 重要性级别可以像 alpha 美学一样作为颜色强度添加到每个正方形，但我认为这不容易解释和捕捉
- 当然，另一个想法是有 4 个不同大小的正方形对应于星星如果星星最高，则将最小的给非重要的，并增加到一个全尺寸的正方形
- 另一个想法是在这些重要的正方形内包含一个圆圈，圆圈的线的粗细对应于重要性级别（剩下的 3 个类别）所有其中一种颜色
- 与上述相同，但固定线条粗细，同时为剩余的 3 个重要级别提供 3 种颜色
- 也许你会想出更好的主意，谁知道？

r ggplot2 correlation heatmap significance

2012-08-30T12:22:25.600

0 投票

2 回答

101 浏览

iphone - 在 viewDidUnload 中将属性设置为 nil 的意义/需要

在这两个方面（即使用 ARC 或不使用 ARC ）将属性设置为nilin有什么意义？viewDidUnload
仅在以下情况下才重要IBOulets吗？我们不需要将其他属性（不是IBOulets）设置为nil吗？
如果我不这样做会有什么后果？我之前没有设置它们nil，也没有观察到任何后果。

非常感谢您的帮助。

iphone memory-management properties null significance

2012-09-17T12:36:36.057

0 投票

0 回答

431 浏览

weka - WEKA SMOreg 分类器显着性检验

我在 WEKA 中使用 SMOreg 分类器来确定一个变量和其他几个变量之间是否存在预测关系。我正在使用 10 倍交叉验证来获得我的结果。我的老师希望我找到自己发现的信心，但这让我感到困惑，因为我认为这是不可能的。如何使用 WEKA 中的 SMOreg 分类器测试显着性？

weka svm confidence-interval cross-validation significance

2012-12-07T00:32:37.693

0 投票

1 回答

2878 浏览

r - r 的显着差异

所以这是我的问题：

我有一堆关于声音制作以及重点放在一个词中的数据。我要做的是确定重读音节和非重读音节的产生之间的差异是否显着。问题是当我尝试使用 cor() 函数时，数据集的长度不同。我有大约 500 个重读音节，但只有 400 个非重读音节。我对 r 很陌生，但这是我尝试过的代码：

当然，我得到一个错误，因为数据集的长度不同。那么如何在不让它们具有相同长度的情况下检查集合之间的重要性呢？

非常感谢！

PS只要问我的问题是否不清楚。恐怕我有时会假设每个人都知道我在做什么...

r statistics significance

2013-01-11T23:39:34.620

0 投票

1 回答

827 浏览

matlab - 来自箱线图输入的 MATLAB student-t 测试

在 Matlab 中，我创建了一些数据箱线图。现在，我想用 Student-T 检验进行统计分析，看看差异是否显着。一些数据是配对的，而另一些则不是，具有方差差异。我认为应该使用双尾测试。它们是matlab中的一个函数来计算来自 boxplot的 Student-T 测试，所以我不需要再次计算输入值？

问候，

文森特

matlab boxplot significance

2013-02-05T19:35:44.520

0 投票

1 回答

2064 浏览

variables - 确定 WEKA 中各个变量的重要性

我试图确定单个变量在 LMT（逻辑模型树）DT（决策树）的 WEKA 实现中的重要性。

我想知道每个单独变量在分类任务中的贡献，因此需要确定每个单独变量的重要性。这是为了对我的结果进行更深入的分析。

我已经查看了“选择属性”选项卡和相应的算法（即主成分、信息增益、排名器等）；但是，这些算法提供了有关哪些组合或变量等级将有助于最好（或最有效或最快，取决于您的最终目标，分类器）的信息。

但是，我对排名或选择最重要的变量不感兴趣。我有兴趣确定每个变量对我的 DT 的最终分类分数有多大贡献（例如以百分比形式）。

我已经考虑一个一个地删除每个变量以确定分数如何变化；但我不确定这是否可以手动完成，因为最终分数可能取决于一些潜在的相关性，这就是为什么我想将所有变量一起使用（即使一个变量的贡献为零）做出此决定。

所以，问题是：有没有办法测量分类器中使用的每个单独变量的贡献（即使该贡献为零）？

提前感谢您的任何帮助。

variables weka decision-tree significance

2013-02-18T16:18:09.377

0 投票

3 回答

25921 浏览

r - 具有显着差异和相互作用的条形图？

我想可视化我的数据和方差分析统计。通常使用带有表示显着差异和相互作用的添加线的条形图来执行此操作。你如何使用 R 制作这样的情节？

这就是我想要的：

显着差异：

显着差异

重要的相互作用：

重要的相互作用

背景

我目前正在使用barplot2{ggplots}绘制条形图和置信区间，但我愿意使用任何包/程序来完成工作。获取我当前使用的统计数据TukeyHSD{stats}或用于差异和用于交互pairwise.t.test{stats}的 anova 函数 ( aov, ezANOVA{ez}, ) 之一。gls{nlme}

只是给你一个想法，这是我目前的情节： barplot2 与 CI

r plot interaction significance

2013-03-20T22:07:40.210

0 投票

1 回答

1743 浏览

r - R 中 TukeyHSD 的结果

我在这里发现了一个类似的问题，但我认为我的问题是我是否正确解释了我的数据。

我做了简单的方差分析，发现在我的数据中我有很大的不同（p.value < 0.05：

然后我做我的 TukeyHSD：

我的输出看起来像这样：

如果我理解正确，我的组与超过 0.0 的 lwr 值的组合是具有最大显着差异的组。这是正确的吗？

我不确定如何检测与 tukeyhsd 有显着差异的组。

这个输出距离实际输出只有几行。我的任务是分析多组并检测具有显着差异的组。

编辑：

现在一个完整的例子：

我的问题是：

如何检测显着差异？使用 p adj 列，如果如何？
（附加问题）我可以执行 Tukey 然后执行 pairwise.wilcoxon 并获得具有显着差异的组的切割集。这是统计数据中更稳健的方式吗？

r significance

2013-05-10T13:55:32.073

问题标签 [significance]

显着差异：

重要的相互作用：

背景

Reference