-1

我正在使用数据集来查看薪水和大学 GPA 之间的关系。我正在使用 sklearn 线性回归模型。我认为系数应该是截距和 coff。对应特征的值。但是该模型给出了一个单一的值。

from sklearn.cross_validation import train_test_split
from sklearn.linear_model import LinearRegression

# Use only one feature : CollegeGPA
labour_data_gpa = labour_data[['collegeGPA']]

# salary as a dependent variable
labour_data_salary = labour_data[['Salary']]

# Split the data into training/testing sets
gpa_train, gpa_test, salary_train, salary_test = train_test_split(labour_data_gpa, labour_data_salary)

# Create linear regression object
 regression = LinearRegression()

# Train the model using the training sets (first parameter is x )
 regression.fit(gpa_train, salary_train)

#coefficients 
regression.coef_

The output is : Out[12]: array([[ 3235.66359637]])
4

3 回答 3

5

尝试:

regression = LinearRegression(fit_intercept =True)
regression.fit(gpa_train, salary_train)

结果将在

regression.coef_
regression.intercept_

为了更好地理解您的线性回归,您可能应该考虑另一个模块,以下教程会有所帮助:http ://statsmodels.sourceforge.net/devel/examples/notebooks/generated/ols.html

于 2016-06-23T08:00:51.963 回答
0
salary_pred = regression.predict(gpa_test)
print salary_pred
print salary_test

alary_pred = regression.coef_*salary_test认为 尝试通过salary_predpyplot打印salary_test。图能说明一切。

于 2016-06-23T07:49:24.287 回答
0

在这里,您正在针对单个特征gpa和目标训练模型salary

regression.fit(gpa_train, salary_train)

如果您在多个特征上训练模型,例如python_gpajava_gpa(目标为salary),那么您将获得两个输出表示方程的系数(对于线性回归模型)和一个截距。

它相当于:(ax + by + c = salary其中c是截距,ab系数)。

于 2020-12-23T18:15:58.877 回答