我坚持在 Rstudio 中为多个类别执行 t.tests。我想得到每种产品类型的 t.test 的结果,比较线上和线下的价格。我有超过 800 种产品类型,这就是为什么不想为每个产品组手动操作的原因。
我有一个名为 data 的数据框(超过 200 万行),如下所示:
> Product_type Price_Online Price_Offline
1 A 48 37
2 B 29 22
3 B 32 40
4 A 38 36
5 C 32 27
6 C 31 35
7 C 28 24
8 A 47 42
9 C 40 36
理想情况下,我希望 R 将 t.test 的结果写入另一个名为 product_types 的数据框:
> Product_type
1 A
2 B
3 C
4 D
5 E
6 F
7 G
8 H
9 I
800 ...
变成:
> Product_type t df p-value interval mean of difference
1 A
2 B
3 C
4 D
5 E
6 F
7 G
8 H
9 I
800 ...
如果我在不同的数据框中拥有所有产品类型,这就是公式:
t.test(Product_A$Price_Online, Product_A$Price_Offline, mu=0, alt="two.sided", paired = TRUE, conf.level = 0.99)
必须有一种更简单的方法来做到这一点。否则我需要制作 800+ 个数据帧,然后执行 t 检验 800 次。
我尝试了列表和 lapply 的东西,但到目前为止它不起作用。我还在多个列上尝试了 t-Test: https ://sebastiansauer.github.io/multiple-t-tests-with-dplyr/
但是,最后他仍然手动插入男性和女性(对我来说超过 800 个类别)。