繁体   English   中英

难以在sklearn中拟合多项式回归曲线

[英]Trouble fitting a polynomial regression curve in sklearn

我是sklearn的新手,我有一个简单的任务:给定15点的散点图,我需要

  1. 将其中11个作为我的“培训样本”,
  2. 通过这11个点拟合3度的多项式曲线;
  3. 在15个点上绘制所得的多项式曲线。

但是我陷入了第二步。

这是数据图:

%matplotlib notebook

import numpy as np from sklearn.model_selection 
import train_test_split from sklearn.linear_model 
import LinearRegression from sklearn.preprocessing import PolynomialFeatures

np.random.seed(0) 
n = 15 
x = np.linspace(0,10,n) + np.random.randn(n)/5 
y = np.sin(x)+x/6 + np.random.randn(n)/10

X_train, X_test, y_train, y_test = train_test_split(x, y, random_state=0)

plt.figure() plt.scatter(X_train, y_train, label='training data') 
plt.scatter(X_test, y_test, label='test data') 
plt.legend(loc=4);

然后,我将X_train的11个点转换为3级的多边形特征,如下所示:

degrees = 3
poly = PolynomialFeatures(degree=degree)

X_train_poly = poly.fit_transform(X_train)

然后,我尝试使一条直线穿过转换后的点(注意: X_train_poly.size = 364)。

linreg = LinearRegression().fit(X_train_poly, y_train)

我收到以下错误:

ValueError: Found input variables with inconsistent numbers of samples: [1, 11]

我已经阅读了解决相似且通常更复杂的问题的各种问题(例如python中的多变量(多项式)最佳拟合曲线? ),但是我无法从中提取解决方案。

问题是X_train和y_train中的尺寸。 它是一维数组,因此将X条记录中的每条记录都视为一个单独的变量。

如下使用.reshape命令应该可以解决问题:

# reshape data to have 11 records rather than 11 columns
X_trainT     = X_train.reshape(11,1)
y_trainT     = y_train.reshape(11,1)

# create polynomial features on the single va
poly         = PolynomialFeatures(degree=3)
X_train_poly = poly.fit_transform(X_trainT)

print (X_train_poly.shape)
# 

linreg       = LinearRegression().fit(X_train_poly, y_trainT)

该错误基本上意味着您的X_train_polyy_train不匹配,其中您的X_train_poly只有1套x,而y_train有11个值。 我不太确定您想要什么,但是我想多项式特征不是按照您想要的方式生成的。 您的代码当前正在执行的操作是为单个11维点生成3级多项式特征。

我想您想为11个点中的每个点(实际上是每个x)生成3度多项式特征。 您可以使用循环或列表理解来做到这一点:

X_train_poly = poly.fit_transform([[i] for i in X_train])
X_train_poly.shape
# (11, 4)

现在,您可以看到X_train_poly有11个点,每个点是4维的,而不是单个364维的点。 这种新X_train_poly的形状相匹配y_train和回归可能会给你想要的东西:

linreg = LinearRegression().fit(X_train_poly, y_train)
linreg.coef_
# array([ 0.        , -0.79802899,  0.2120088 , -0.01285893])

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM