0

我希望我能尽可能清楚。我有一个包含 400 个研究对象的 excel 文件,每个人都有他们的年龄、性别和 40 多列生物变量。es: CODE0001; (年龄)20;男\女; 生物价值1;生物价值 2 .....生物价值 40。

我的目标是使用 1-way Anova 分析这些数据,因为我认为这是我拥有的最佳选择。我正在尝试这样做(即使使用本指南https://www.marsja.se/four-ways-to-conduct-one-way-anovas-using-python/)但代码总是存在问题。

那么:如何设置我的数据以便能够使用例如来自该网站的代码?

我已经为所有数据完成了 Dataset.mean() 和 Dataset.std(),但是我不能使用例如值“平均年龄”,因为 Jupyter 似乎只将它作为字符串而不是值读取.

我处于深深的困惑中,所以所有的帮助都将非常感激!!!

先感谢您

4

2 回答 2

0

使用df.mean()ordf.std()时,尝试将数据更改为pd.Seriesfirst 并运行它。

于 2020-05-19T14:59:08.973 回答
0

我很抱歉,但我不明白。我对 python 比较陌生,所以也许我无法正确解释自己。我需要做一个方差分析:

首先我这样做:

AnalisiISAD.mean()

2)然后我从中列出了一个清单:

MeanList = [......] 3) 然后我继续使用 anova 脚本

AnalisiI.boxplot('MeanList', by='AgeT0', figsize=(12,8))

ctrl = Analisi['MeanList'][Analisi == 'ctrl']

grps = pd.unique(Analisi.group.values)

d_data = {grp:Analisi['MeanList'][Analisi.group ==grp] for grp in grps}

k = len(pd.unique(Analisi.group))

N = len(Analisi.values)

n = Analisi.groupby('AgeT0').size()[0]

但发生此错误:KeyError: 'Column not found: MeanList'

这是否意味着我必须在 excel 文件中创建一个新列?我怎么做?

于 2020-05-19T17:42:27.350 回答