1

有什么方法可以在 numpy.polyfit() 中拟合两个自变量和一个因变量?

我有一个从 csv 文件加载的熊猫数据框。我希望将两列作为自变量包含在内,以使用 NumPy 运行多元线性回归。

目前我的简单线性回归如下所示:

model_combined = np.polyfit(data.Exercise, y, 1)

我也希望包含data.Age在 x 中。

4

1 回答 1

2

假设您的方程是a * exercise + b * age + intercept = y,您可以使用 numpy 或 scikit-learn 拟合多元线性回归,如下所示:

from sklearn import linear_model
import numpy as np
np.random.seed(42)

X = np.random.randint(low=1, high=10, size=20).reshape(10, 2)
X = np.c_[X, np.ones(X.shape[0])]  # add intercept
y = np.random.randint(low=1, high=10, size=10)

# Option 1
a, b, intercept = np.linalg.pinv((X.T).dot(X)).dot(X.T.dot(y))
print(a, b, intercept)

# Option 2
a, b, intercept = np.linalg.lstsq(X,y, rcond=None)[0]
print(a, b, intercept)

# Option 3
clf = linear_model.LinearRegression(fit_intercept=False)
clf.fit(X, y)
print(clf.coef_)
于 2021-01-29T23:17:15.437 回答