python-3.x - CSV 导入到 t 检验

问问题 2017-02-27T16:09:27.850

426 次

我有一个 .csv 文件，其中包含需要对其进行双尾 t 检验的特定列。这是我的 .csv 文件的示例：

Type|No.|Count
A   |2  |4
B   |5  |2

我需要将两种类型（A 和 B）分配给 t 检验的不同变量。更具体地说，我需要一个 for 循环（我假设），它将使用文件中所有 A 类型的 No. 值并进行双尾 t 检验，比较 A 类型和 B 类型的 No. 值。然后，我需要对所有 A 类型和 B 类型的 Count 值进行另一个双尾 t 检验。我一直在看熊猫，这似乎对排序 .csv 文件很有用。我用它做了一个看起来像这样的测试：

groupby_type = data.groupby('A_B')
for type, value in groupby_type['No.']:
    print((type, value.mean()))

这会产生正确的结果。但是，当我尝试使用 scipy-lectures 中的示例进行双尾 t 检验时，我得到了 NAN 结果。这是代码：

A_type = (data[data['A_B'] == 'A']['No.'])
B_type = (data[data['A_B'] == 'B']['No.'])
sig = scipy.stats.ttest_ind([A_type], [B_type])

当它运行时，我收到以下消息：

Ttest_indResult(statistic=nan, pvalue=nan)

我不知道为什么这会获得 nan 值，并且无法理解如何解决这个问题。谢谢！

python-3.x - CSV 导入到 t 检验

0 回答 0

Related

Reference