我正在使用 python 3.6 对数据集运行一些统计测试。我想要完成的是在数据集和趋势线之间运行 t 检验以确定统计显着性。我和使用 scipy 来做到这一点但是我不确定我应该在测试中包含哪些变量以获得我需要的结果。
到目前为止,这是我的代码:
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
p = np.load('data.npy')
#0=1901
start=0
end=100
plt.figure()
plt.plot(a,annualmean, '-')
slope, intercept, r_value, p_value, std_err = stats.linregress(a,annualmean)
plt.plot(a,intercept+slope*a, 'r')
annualmean=[]
for n in range(start,end):
annualmean.append(np.nanmean(p[n]))
#Trendline Plots
a=range(start,end)
year1 = 1901
print(stats.ttest_ind(annualmean,a))
现在代码正在运行,没有错误消息,但是我得到了一个非常小的 p 值,我认为它是不正确的。如果有人知道我应该将哪些变量写入 t 检验,那将非常有帮助。谢谢!