[英]How can I create a Linear Regression Model from a split dataset?
我只是将数据拆分为训练和测试集,我的计划是训练线性回归模型,并能够使用测试拆分检查性能。
我当前的代码是:
import pandas as pd
import numpy as np
from sklearn import datasets, linear_model
import matplotlib.pyplot as plt
df = pd.read_csv('C:/Dataset.csv')
df['split'] = np.random.randn(df.shape[0], 1)
split = np.random.rand(len(df)) <= 0.75
training_set = df[split]
testing_set = df[~split]
我应该使用适当的方法从外部文件(例如.csv)绘制线性回归模型吗?
由于您想使用scikit-learn,因此这是使用sklearn.linear_model.LinearRegression
的方法:
from sklearn.linear_model import LinearRegression
model = LinearRegression()
X_train, y_train = training_set[x_vars], training_set[y_var]
X_test, y_test = testing_test[x_vars], testing_test[y_var]
model.fit(X_train, y_train)
predictions = model.predict(X_test)
根据您是否需要更多描述性输出,还可以考虑使用statsmodels
进行线性回归。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.