0

我有这个问题。我正在尝试进行线性回归并测试斜率。t 检验检查斜率是否远离 0。斜率可以是负数或正数。我只对负斜率感兴趣。

在这个例子中,斜率是正的,我不感兴趣,所以 P 值应该很大。但它很小,因为现在它测试斜率是否在任一方向上远离 0。(我强制截距为零,这是我想要的)。有人可以帮我看看斜率是否只是负数。在这种情况下,P 值应该很大。

我该如何更改为 99% 置信水平或 95% 或...?

import statsmodels.api as sm
import matplotlib.pyplot as plt
import numpy
X = [-0.013459134, 0.01551033, 0.007354476, 0.014686473, -0.014274754, 0.007728445, -0.003034186, -0.007409397]
Y = [-0.010202462, 0.003297546, -0.001406498, 0.004377665, -0.009244517, 0.002136552, 0.006877126, -0.001494624]
regression_results = sm.OLS (Y, X, missing = "drop").fit ()
P_value = regression_results.pvalues [0]
R_squared = regression_results.rsquared
K_slope = regression_results.params [0]
conf_int = regression_results.conf_int ()
low_conf_int = conf_int [0][0]
high_conf_int = conf_int [0][1]
fig, ax = plt.subplots ()
ax.grid (True)
ax.scatter (X, Y, alpha = 1, color='orchid')
x_pred = numpy.linspace (min (X), max (X), 40)
y_pred = regression_results.predict (x_pred)
ax.plot (x_pred, y_pred, '-', color='darkorchid', linewidth=2)
4

1 回答 1

3

双向 t 检验的 p 值通过以下方式计算:

import scipy.stats as ss
df = regression_results.df_resid
ss.t.sf(regression_results.tvalues[0], df) * 2 # About the same as (1 - cdf) * 2.
# see @user333700's comment
Out[12]: 0.02903685649821508

您的修改将是:

ss.t.cdf(regression_results.tvalues[0], df)
Out[14]: 0.98548157175089246

因为你只对左尾感兴趣。

对于置信区间,您只需要传递 alpha 参数:

regression_results.conf_int(alpha=0.01)

对于 99% 的置信区间。

于 2017-04-13T11:11:24.583 回答