![](/img/trans.png)
[英]GridSearchCV on LogisticRegression in scikit-learn
[英]scikit-learn LogisticRegression Classify another value
我是 python 的新手,必须完成自然语言处理任务。 使用 kaggle 数据集,情感分类应该使用 python 来实现。 为此,我使用 dataframe 和 LogisticRegression,如本文所述,一切正常。
现在我想知道是否可以对不在数据集中的另一个字符串进行分类,以便我可以交互地试验分类器。
这可能吗? 谢谢!
您将不得不手动对新数据运行所有预处理,而不是预测。
那是:
因此,首先(数据清理)和您调用的其他编辑数据的函数,
然后运行 (Create a bag of words) 部分,并且只
然后使用拟合的 LR model 来预测这个(预处理的)数据。
是的,这是可能的。
为了使其更加模块化,您可以创建一个 function 并将输入字符串传递给该 function 进行预处理。 这可以减少代码冗余。 对于训练数据预处理,您可以直接将数据传递给 function。
完成后,您需要为测试句子创建词袋。
然后你可以使用预测 function 训练 LR model 来预测 output。
谢谢你。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.