问题标签 [rstatix]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何选择具有可在多个组内进行比较的数据的组(使用 dplyr 和 rstatix)?
我想在组内按性别进行 t 检验。我有两个组变量(group_1 和 group_2)和多个结果变量(var1 和 var2 - 尽管在我的数据集中我有很多变量)。
上面的代码给了我以下错误:
此代码仅适用于一组,或者如果我删除了正确的数据:
Y 组和 B 组类别中没有女性,所以如果我手动删除它们,代码就可以工作。我尝试了类似下面的方法来自动检测和删除这些类别,但这无济于事,因为如果每个类别没有男性或没有女性,它就无法删除数据。
如何自动删除无法运行 t 检验的类别?我的数据集中的每个组都有超过 3 个类别,因此手动选择每个组会很困难。
r - 使用 rstatix 的简单 2 向交互警告消息
我正在使用带有rstatix
包的 r 来分析我的数据,但是rstatix
当我尝试在第三个变量的每个级别确定简单的双向交互时,我收到了来自包的警告消息。
我的实验设计是 3 路混合方差分析,其中 2 和 1 在主题因素内。主体因子之间的 2 是rpm
和ratio
,而因子之间的 1 是time
。是在几个时期val
测量的因变量。time
我已将我的数据简化如下:
我收到的警告信息是:
我认为警告是因为该id
列有两次数字 1 到 12 的集合。该组重复两次,因为每个受试者id
在 = 0 时测量两次,time
然后在 3 时测量。
更新:
我认为这是rstatix
. 以下等效项不会产生任何问题:
r - rstatix::dunn_test 中的公式有问题
我写了一个函数来解析 data.frame,它抛出了一个我无法解决的 rstatix::dunn_test 错误。这是因为变量名称不正确地传递给公式。
这给出了一个错误:
存在带有数据的“SF36”列和带有分组因子的“治疗”列。我检查了它的工作原理:
或者
有谁知道如何解决这个问题?
r - 对 RMANOVA 进行组比较 Shapiro-Wilks 测试时遇到问题
我目前正在使用 datarium 包中的“weightloss”数据集开始运行 RMANOVA。这是输出:
所以这是我到目前为止想出的脚本:
我得到了这个看起来很正常的箱线图:
现在是时候找出异常值并检验正态性了。
这又给了我一个非常正常的 QQplot:
然后我通过试验包装了数据:
从我能说的情况来看,它是正确的:
但是,当我尝试按组进行 Shapiro Wilk 测试时,我一直遇到以下代码问题:
它给了我这个错误:
错误:
mutate()
列有问题data
。我data = map(.data$data, .f, ...)
。x 必须按 中的变量分组.data
。
variable
未找到列。
我也试过这个:
而是得到这个错误:
错误:不能对不存在的列进行子集化。x 列
trial$value
不存在。
如果有人对原因有所了解,我将不胜感激!
r - 使用 rstatix 运行单向重复测量 anova 但无法正常工作
请在阅读之前阅读此内容:
对 RMANOVA 进行组比较 Shapiro-Wilks 测试时遇到问题
如您所见,我已经解决了获取图和正态性检查的问题。现在我只是想让实际的方差分析本身起作用。据我所知,anova_test 的帮助页面说这是默认公式:
所以我使用了这个命令:
它似乎不起作用,只给我这个错误:
或者,我试过这个:
但是,它只会给我另一个错误:
现在这很明显,因为 t1:t3 不再是列,但我不确定我的原始代码可能存在哪些其他问题。最后,我尝试通过 aov 执行此操作:
这似乎可行,但是 1)我不能像 rstatix 那样添加重要性和 2)我觉得它比 rstatix 更难阅读。
如果有帮助,这是整个 R 脚本:
r - 如何使用 R 识别和删除 data.frame 中的异常值?
我有一个具有多个异常值的数据框。我怀疑这些 ouliers 产生的结果与预期不同。
我尝试使用这个技巧,但它没有用,因为我仍然有非常不同的值:https ://www.r-bloggers.com/2020/01/how-to-remove-outliers-in-r/
我尝试了使用rstatix
包的解决方案,但我无法从我的 data.frame 中删除异常值
r - 对多个列表中的多个变量进行统计测试(小标题)
为了简化我的数据分析,我需要对不同的变量和不同的数据组处理不同的统计测试(在该示例中为 shapiro 测试)。目的是不要编写 150 次相同的代码。为此,我从我的数据集中创建了一个 tibble,其中每个列表对应于一组数据。
数据集:
为此,我使用group_split
了 package中的函数dplyr
,它创建了一个对应于每个组 (ctd_file) 的不同列表的小标题。在我尝试将shapiro.test
包rstatix
中的每个选定变量应用到一个组的每个选定变量之后,sapply
以及应用到每个组的lapply
.
如果我使用过滤器提取一组并且不创建小标题,则sapply
应用于每个变量的函数都有效。因此,问题来自 tibble 而不是所选列的应用程序。
r - 如何在ggplot中重新排列重要线的x位置?
请在此处找到我需要可视化的数据。我想揭示是否有任何变量与参考变量显着不同。我绘制条形图,列出将相互比较的变量,进行统计并绘制显着性线,如下所示。到目前为止一切都很好。
但是,当我重新排列变量在 x 轴上的位置时,通过使用scale-x-discrete
有效线的 x 位置不会改变。
我怎么解决这个问题?如果您能揭露我的错误,我将非常高兴。
谢谢
r - 汇总数据时丢失 R 因子组织 (dplyr)
我试图通过几个分类因素以及日期来总结一个数字响应变量(地上生物量 [AGB])作为更大项目的一部分。日期被读取为一个字符,并被组织为 2020 年 4 月 10 日、2020 年 4 月 8 日、2020 年 4 月 9 日。此外,还有一列,Shoot.Plot,编号为 1-11,按顺序排列:1、10、11、2... 等等,因为它被读取为字符串(这在大多数情况下都很好)从奇怪的顺序)。我已将因素重新调整为我想要的,但是当我使用get_summary_stats()
from rstatix()
package 或 using总结数据时summarize()
,级别组织会丢失。
这是我尝试过的:
当我检查get_summary_stats()
行前的数据框时,数据按照我在 mutate 函数中指定的方式组织。只有在总结之后,这两个才走出窗外。
有什么建议么?谢谢!
r - 在函数中使用 tukey_hsd() 和在 R 中使用 add_xy_position() 的问题
从函数内部的 rstatix 包中add_xy_position()
使用后,我遇到了问题。tukey_hsd()
这就是我的函数的样子:
当我使用以下代码调用该函数时,它工作得很好,并且测试结果保存在 data.frame 中:
但是,当我尝试像这样添加使用的 x 和 y 坐标dat$factor_var
时add_xy_position()
:
我收到以下错误消息:
但是,当我tukey_hsd()
在我的函数之外使用时,代码工作得非常好,并且坐标被添加到 data.frame 中。
我将非常感谢一些有用的建议,因为我不知道为什么在我的函数中使用它时代码不起作用。