我正在尝试在数据框中做 kruskal-wallis。在行中——我有 4 组数据(4 种疾病诊断),每组有 6 名患者。在列中——我有大约 7000 个基因。
我正在尝试在每个基因的 4 组中执行 kruskal-wallis/ANOVA。
我可以通过这段代码来做到这一点-
stats.kruskal(*[group["gene_1"].values for name, group in df.groupby("disease_diagnosis")])
这给出了基因 1 的 p 值
我试图通过我尝试了这段代码的 7000 个基因(在列中)来完成这项工作。
for key, value in df.iteritems():
kw_table = stats.kruskal(*[value.values for name, group in
df.groupby("disease_diagnosis")])
print(kw_table)
这在我尝试过的其他方法中不起作用。将有助于获得一些指导..谢谢