繁体   English   中英

scikit-learn LogisticRegression 分类另一个值

[英]scikit-learn LogisticRegression Classify another value

我是 python 的新手,必须完成自然语言处理任务。 使用 kaggle 数据集,情感分类应该使用 python 来实现。 为此,我使用 dataframe 和 LogisticRegression,如本文所述,一切正常。

现在我想知道是否可以对不在数据集中的另一个字符串进行分类,以便我可以交互地试验分类器。

这可能吗? 谢谢!

您将不得不手动对新数据运行所有预处理,而不是预测。

那是:

因此,首先(数据清理)和您调用的其他编辑数据的函数,
然后运行 (Create a bag of words) 部分,并且只
然后使用拟合的 LR model 来预测这个(预处理的)数据。

是的,这是可能的。

为了使其更加模块化,您可以创建一个 function 并将输入字符串传递给该 function 进行预处理。 这可以减少代码冗余。 对于训练数据预处理,您可以直接将数据传递给 function。

完成后,您需要为测试句子创建词袋。

然后你可以使用预测 function 训练 LR model 来预测 output。

谢谢你。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM