我是 R(和一般统计数据)的新手,所以提前为这可能是一个非常补救的问题道歉,但我很感激任何帮助!
我正在尝试评估在给定车道上开始赛车比赛是否有统计优势。
我拥有的样本量很小,不一定呈正态分布,因此我选择使用 chi sq 检验来检查预期胜利与观察胜利之间的显着差异。
#create lanes var
lane_num <- c(1:10)
#num wins per lane
num_wins <- c(8, 7, 10, 7, 6, 3, 6, 4, 1, 0)
#create df
df <- as.data.frame(cbind(lane_num, num_wins))
#convert lanes_num factor
df$lane_num <- as.factor(df$lane_num)
#check str
str(df)
#run chisq
chi_res <- chisq.test(df$num_wins)
#check results
chi_res
#check for sig diff between lanes
chisq.post.hoc(df) #this is where i'm having issues
chisq.test 的结果给出了以下结果,表明观察到的预期 v 之间存在显着差异;
Chi-squared test for given probabilities
data: df$num_wins
X-squared = 17.231, df = 9, p-value = 0.04522
我正在苦苦挣扎的地方是在车道之间进行事后测试,以确切地了解哪些从开始时明显更有优势。
简单地运行:
chisq.post.hoc(df)
返回以下错误;
Error in test(tbl[prs[, i], ], ...) :
all entries of 'x' must be nonnegative and finite
正如我所说,我是 R 和 stats 的新手,因此提供的有关 chisq.post.hoc 的文档对我来说没有多大意义 - 加上似乎不再支持该软件包,所以我不得不下载存档版本. 我尝试了各种方法,但都产生错误。例如;
chisq.post.hoc(df$num_wins, control = "bonferroni")
> Error in 1:nrow(tbl) : argument of length 0
我真的很感激对此的指导或任何关于我可以使用的替代事后测试的建议,以及在运行之前需要如何构建数据等。
提前致谢!