簡體   English   中英

使用R對文本數據進行預測

[英]prediction on text data using R

我的數據框中有兩列:文本和類別

示例文本:實際文本數據要大得多。兩列用|分隔。

Text|Category
I want to get financial advise|financial advise
can I get my loan approved?| loan query
how many years of credit history required?|credit card query

我想分析文本列並預測類別。 在實際數據中,有100個這樣的類別。 這樣做的最佳方法是什么? 我正在用R語言這樣做。

您的任務可以拆分為子任務:

  1. 將“類別”變量值轉換為整數。

  2. 通過使用“整潔的文本”方法將“文本”變量處理為簡單值。

  3. 應用其中一種模型進行多類分類,例如,像這樣的R中帶有XGBoost的多類分類

這是解決任務的非常通用的方法。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM