1

我有一个 .csv 文件,其中包含需要对其进行双尾 t 检验的特定列。这是我的 .csv 文件的示例:

Type|No.|Count
A   |2  |4
B   |5  |2

我需要将两种类型(A 和 B)分配给 t 检验的不同变量。更具体地说,我需要一个 for 循环(我假设),它将使用文件中所有 A 类型的 No. 值并进行双尾 t 检验,比较 A 类型和 B 类型的 No. 值。然后,我需要对所有 A 类型和 B 类型的 Count 值进行另一个双尾 t 检验。我一直在看熊猫,这似乎对排序 .csv 文件很有用。我用它做了一个看起来像这样的测试:

groupby_type = data.groupby('A_B')
for type, value in groupby_type['No.']:
    print((type, value.mean()))

这会产生正确的结果。但是,当我尝试使用 scipy-lectures 中的示例进行双尾 t 检验时,我得到了 NAN 结果。这是代码:

A_type = (data[data['A_B'] == 'A']['No.'])
B_type = (data[data['A_B'] == 'B']['No.'])
sig = scipy.stats.ttest_ind([A_type], [B_type])

当它运行时,我收到以下消息:

Ttest_indResult(statistic=nan, pvalue=nan)

我不知道为什么这会获得 nan 值,并且无法理解如何解决这个问题。谢谢!

4

0 回答 0