[英]Features in SVM based Sentiment Analysis
我無法將語義和詞匯信息轉換為特征向量。
我知道以下信息
我的問題是如何將它們表示為實數值。我應該只是選擇每個特征(POS,感測等)(即布爾向量)的出現,但是在n元語法的情況下語義信息將會丟失(在情感分析的情況下,非常好的男孩和好男孩具有不同的語義傾向)。
沒有將標稱值轉換為實值向量的好方法。 最常見的方法是您所建議的-轉換為布爾向量。 如果是n-gram,我看不出你的意思。 你的目的是什么? 您說您擁有POS,POS是單詞的一個功能,而n-gram在單個單詞級別上沒有意義,而是作為句子部分的表示。 您是說“它出現在哪里”嗎? 然后,它與“前一個單詞”(或n-1個前一個單詞)完全相同,然后您就不會丟失任何信息(因為每個“前一個”單詞都具有k個維,其中k是詞匯的大小)。 請記住,您的代表將是巨大的 。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.