sklearn 線性回歸系數具有單值輸出

Question

我正在使用數據集來查看薪水和大學 GPA 之間的關系。 我正在使用 sklearn 線性回歸模型。 我認為系數應該是截距和 coff。 對應特征的值。 但該模型給出了一個單一的值。

from sklearn.cross_validation import train_test_split
from sklearn.linear_model import LinearRegression

# Use only one feature : CollegeGPA
labour_data_gpa = labour_data[['collegeGPA']]

# salary as a dependent variable
labour_data_salary = labour_data[['Salary']]

# Split the data into training/testing sets
gpa_train, gpa_test, salary_train, salary_test = train_test_split(labour_data_gpa, labour_data_salary)

# Create linear regression object
 regression = LinearRegression()

# Train the model using the training sets (first parameter is x )
 regression.fit(gpa_train, salary_train)

#coefficients 
regression.coef_

The output is : Out[12]: array([[ 3235.66359637]])

Answer 1

嘗試：

regression = LinearRegression(fit_intercept =True)
regression.fit(gpa_train, salary_train)

結果將在

regression.coef_
regression.intercept_

為了更好地理解您的線性回歸，您可能應該考慮另一個模塊，以下教程有幫助： http : //statsmodels.sourceforge.net/devel/examples/notebooks/generated/ols.html

Answer 2

salary_pred = regression.predict(gpa_test)
print salary_pred
print salary_test

我認為 s alary_pred = regression.coef_*salary_test 。 有一個嘗試，印刷salary_pred和salary_test通過pyplot。 圖可以解釋一切。

Answer 3

在這里，您正在根據單個特征gpa和目標salary訓練模型：

regression.fit(gpa_train, salary_train)

如果您在多個特征上訓練您的模型，例如python_gpa和java_gpa （目標為salary ），那么您將得到兩個表示方程系數的輸出（對於線性回歸模型）和一個截距。

等價於： ax + by + c = salary （其中c是截距， a和b是系數）。

sklearn 線性回歸系數具有單值輸出

問題描述

3 個解決方案

解決方案1
5 2016-06-23 08:00:51

解決方案2
0 2016-06-23 07:49:24

解決方案3
0 2020-12-23 18:15:58

sklearn 線性回歸系數具有單值輸出

問題描述

3 個解決方案

解決方案1 5 2016-06-23 08:00:51

解決方案2 0 2016-06-23 07:49:24

解決方案3 0 2020-12-23 18:15:58

解決方案1
5 2016-06-23 08:00:51

解決方案2
0 2016-06-23 07:49:24

解決方案3
0 2020-12-23 18:15:58