python - 从相关系数中找到 p 值

Question

我有一本包含相关值的字典，

{u'1306': -0.20028268502286309, u'678': nan, u'575': -0.41858161444186959,   u'889': nan, u'984': -1.0, u'258': nan, u'1203': -0.34074604870778746, u'1000': -0.39718585102729265}

如何找到上述结果的 p 值，我使用下面的代码来获取值

def calculate_pvalue(self,data,size):
    self.data=data
    self.size=size
    self.pvalue=self.data*math.sqrt((self.size-2)/(1-pow(self.data,2)))
    return(self.pvalue)

我得到的结果如下，

{u'1306': -109.51766328031098, u'678': nan, u'1203': -194.16993218970686, u'889': nan, u'984': -inf, u'258': nan, u'575': -246.9217742472556, u'1000': -231.85995387407439}

但我的问题是 p 值必须是概率？如何获得上述相关性的 p 值，我找到相关性的步骤是否正确？

score 0 · Accepted Answer

您正在计算t的值，如下所述：http ://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient#Testing_using_Student.27s_t-distribution

然后，您应该从学生的t分布中查找p值。

请参阅如何使用 numpy 计算统计“t-test”。

python - 从相关系数中找到 p 值

1 回答 1

Related

Reference