问题标签 [rstatix]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
47 浏览

r - 如何选择具有可在多个组内进行比较的数据的组(使用 dplyr 和 rstatix)?

我想在组内按性别进行 t 检验。我有两个组变量(group_1 和 group_2)和多个结果变量(var1 和 var2 - 尽管在我的数据集中我有很多变量)。

上面的代码给了我以下错误:

此代码仅适用于一组,或者如果我删除了正确的数据:

Y 组和 B 组类别中没有女性,所以如果我手动删除它们,代码就可以工作。我尝试了类似下面的方法来自动检测和删除这些类别,但这无济于事,因为如果每个类别没有男性或没有女性,它就无法删除数据。

如何自动删除无法运行 t 检验的类别?我的数据集中的每个组都有超过 3 个类别,因此手动选择每个组会很困难。

0 投票
0 回答
30 浏览

r - 使用 rstatix 的简单 2 向交互警告消息

我正在使用带有rstatix包的 r 来分析我的数据,但是rstatix当我尝试在第三个变量的每个级别确定简单的双向交互时,我收到了来自包的警告消息。

我的实验设计是 3 路混合方差分析,其中 2 和 1 在主题因素内。主体因子之间的 2 是rpmratio,而因子之间的 1 是time。是在几个时期val测量的因变量。time

我已将我的数据简化如下:

我收到的警告信息是:

我认为警告是因为该id列有两次数字 1 到 12 的集合。该组重复两次,因为每个受试者id在 = 0 时测量两次,time然后在 3 时测量。

更新:

我认为这是rstatix. 以下等效项不会产生任何问题:

0 投票
2 回答
49 浏览

r - rstatix::dunn_test 中的公式有问题

我写了一个函数来解析 data.frame,它抛出了一个我无法解决的 rstatix::dunn_test 错误。这是因为变量名称不正确地传递给公式。

这给出了一个错误:

存在带有数据的“SF36”列和带有分组因子的“治疗”列。我检查了它的工作原理:

或者

有谁知道如何解决这个问题?

0 投票
1 回答
31 浏览

r - 对 RMANOVA 进行组比较 Shapiro-Wilks 测试时遇到问题

我目前正在使用 datarium 包中的“weightloss”数据集开始运行 RMANOVA。这是输出:

所以这是我到目前为止想出的脚本:

我得到了这个看起来很正常的箱线图:

箱形图

现在是时候找出异常值并检验正态性了。

这又给了我一个非常正常的 QQplot:

QQ图

然后我通过试验包装了数据:

从我能说的情况来看,它是正确的:

QQPLOT FACETED

但是,当我尝试按组进行 Shapiro Wilk 测试时,我一直遇到以下代码问题:

它给了我这个错误:

错误:mutate()列有问题data。我data = map(.data$data, .f, ...)。x 必须按 中的变量分组.data

  • variable未找到列。

我也试过这个:

而是得到这个错误:

错误:不能对不存在的列进行子集化。x 列trial$value 不存在。

如果有人对原因有所了解,我将不胜感激!

0 投票
0 回答
91 浏览

r - 使用 rstatix 运行单向重复测量 anova 但无法正常工作

请在阅读之前阅读此内容:

对 RMANOVA 进行组比较 Shapiro-Wilks 测试时遇到问题

如您所见,我已经解决了获取图和正态性检查的问题。现在我只是想让实际的方差分析本身起作用。据我所知,anova_test 的帮助页面说这是默认公式:

所以我使用了这个命令:

它似乎不起作用,只给我这个错误:

或者,我试过这个:

但是,它只会给我另一个错误:

现在这很明显,因为 t1:t3 不再是列,但我不确定我的原始代码可能存在哪些其他问题。最后,我尝试通过 aov 执行此操作:

aov

这似乎可行,但是 1)我不能像 rstatix 那样添加重要性和 2)我觉得它比 rstatix 更难阅读。

如果有帮助,这是整个 R 脚本:

0 投票
2 回答
451 浏览

r - 如何使用 R 识别和删除 data.frame 中的异常值?

我有一个具有多个异常值的数据框。我怀疑这些 ouliers 产生的结果与预期不同。

我尝试使用这个技巧,但它没有用,因为我仍然有非常不同的值:https ://www.r-bloggers.com/2020/01/how-to-remove-outliers-in-r/

我尝试了使用rstatix包的解决方案,但我无法从我的 data.frame 中删除异常值

0 投票
2 回答
91 浏览

r - 对多个列表中的多个变量进行统计测试(小标题)

为了简化我的数据分析,我需要对不同的变量和不同的数据组处理不同的统计测试(在该示例中为 shapiro 测试)。目的是不要编写 150 次相同的代码。为此,我从我的数据集中创建了一个 tibble,其中每个列表对应于一组数据。

数据集:

为此,我使用group_split了 package中的函数dplyr,它创建了一个对应于每个组 (ctd_file) 的不同列表的小标题。在我尝试将shapiro.testrstatix中的每个选定变量应用到一个组的每个选定变量之后,sapply以及应用到每个组的lapply.

如果我使用过滤器提取一组并且不创建小标题,则sapply应用于每个变量的函数都有效。因此,问题来自 tibble 而不是所选列的应用程序。

0 投票
0 回答
104 浏览

r - 如何在ggplot中重新排列重要线的x位置?

请在此处找到我需要可视化的数据。我想揭示是否有任何变量与参考变量显着不同。我绘制条形图,列出将相互比较的变量,进行统计并绘制显着性线,如下所示。到目前为止一切都很好。

此图像中重要线的位置是正确的,但是我想重新排列变量

但是,当我重新排列变量在 x 轴上的位置时,通过使用scale-x-discrete有效线的 x 位置不会改变。

此图像中重要线的定位不正确

我怎么解决这个问题?如果您能揭露我的错误,我将非常高兴。

谢谢

0 投票
1 回答
31 浏览

r - 汇总数据时丢失 R 因子组织 (dplyr)

我试图通过几个分类因素以及日期来总结一个数字响应变量(地上生物量 [AGB])作为更大项目的一部分。日期被读取为一个字符,并被组织为 2020 年 4 月 10 日、2020 年 4 月 8 日、2020 年 4 月 9 日。此外,还有一列,Shoot.Plot,编号为 1-11,按顺序排列:1、10、11、2... 等等,因为它被读取为字符串(这在大多数情况下都很好)从奇怪的顺序)。我已将因素重新调整为我想要的,但是当我使用get_summary_stats()from rstatix()package 或 using总结数据时summarize(),级别组织会丢失。

这是我尝试过的:

当我检查get_summary_stats()行前的数据框时,数据按照我在 mutate 函数中指定的方式组织。只有在总结之后,这两个才走出窗外。

有什么建议么?谢谢!

0 投票
1 回答
86 浏览

r - 在函数中使用 tukey_hsd() 和在 R 中使用 add_xy_position() 的问题

从函数内部的 rstatix 包中add_xy_position()使用后,我遇到了问题。tukey_hsd()这就是我的函数的样子:

当我使用以下代码调用该函数时,它工作得很好,并且测试结果保存在 data.frame 中:

但是,当我尝试像这样添加使用的 x 和 y 坐标dat$factor_varadd_xy_position()

我收到以下错误消息:

但是,当我tukey_hsd()在我的函数之外使用时,代码工作得非常好,并且坐标被添加到 data.frame 中。

我将非常感谢一些有用的建议,因为我不知道为什么在我的函数中使用它时代码不起作用。