[英]prediction on text data using R
我的數據框中有兩列:文本和類別
示例文本:實際文本數據要大得多。兩列用|分隔。
Text|Category
I want to get financial advise|financial advise
can I get my loan approved?| loan query
how many years of credit history required?|credit card query
我想分析文本列並預測類別。 在實際數據中,有100個這樣的類別。 這樣做的最佳方法是什么? 我正在用R語言這樣做。
您的任務可以拆分為子任務:
將“類別”變量值轉換為整數。
通過使用“整潔的文本”方法將“文本”變量處理為簡單值。
應用其中一種模型進行多類分類,例如,像這樣的R中帶有XGBoost的多類分類
這是解決任務的非常通用的方法。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.