繁体   English   中英

线性回归训练/形状 output 不正确

[英]linear regression train/shape output not correct

我正在尝试使用线性回归来预测未来几年将发布的节目数量。 我有一个数据框,其中每一行都是一个发布,其中包含发布年份、流派等信息......我想用它来预测即将发布的版本数量,所以我所做的是制作一个新的 dataframe在所有唯一年份和 count_values 中获取当年的发布数量。 所以现在我有 85 行,其中 2 列,1 列是年份,另一列是发布量。

我为此使用 sklearn,这是我迄今为止编写的代码。

x = ML_content.drop('releases', axis = 1)
#x = ML_content['years']
y = ML_content['releases']
x_train, y_train, x_test, y_test = train_test_split(x, y, test_size = 20)
x_train.shape, y_train.shape
model = linear_model.LinearRegression()
model.fit(x_train, y_train)

形状过程的结果是我认为我想要的不正确(这是结果: ((42, 1), (43, 1)) ),因此以下代码也不起作用。 谁能解释我做错了什么或需要发生什么来改变这一点。

感谢您的时间和帮助

根据https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html
train_test_split 的返回顺序与您的顺序不同。
返回顺序为:X_train, X_test, y_train, y_test
你得到了:x_train、y_train、x_test、y_test

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM