繁体   English   中英

如何从拆分数据集中创建线性回归模型?

[英]How can I create a Linear Regression Model from a split dataset?

我只是将数据拆分为训练和测试集,我的计划是训练线性回归模型,并能够使用测试拆分检查性能。

我当前的代码是:

import pandas as pd
import numpy as np
from sklearn import datasets, linear_model
import matplotlib.pyplot as plt

df = pd.read_csv('C:/Dataset.csv')
df['split'] = np.random.randn(df.shape[0], 1)
split = np.random.rand(len(df)) <= 0.75
training_set = df[split]
testing_set = df[~split]

我应该使用适当的方法从外部文件(例如.csv)绘制线性回归模型吗?

由于您想使用scikit-learn,因此这是使用sklearn.linear_model.LinearRegression的方法:

from sklearn.linear_model import LinearRegression

model = LinearRegression()

X_train, y_train = training_set[x_vars], training_set[y_var]
X_test, y_test = testing_test[x_vars], testing_test[y_var]

model.fit(X_train, y_train)

predictions = model.predict(X_test)

根据您是否需要更多描述性输出,还可以考虑使用statsmodels进行线性回归。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM