簡體   English   中英

基於SVM的情感分析功能

[英]Features in SVM based Sentiment Analysis

我無法將語義和詞匯信息轉換為特征向量。

我知道以下信息

  • 語音標記的一部分-POS標記器的輸出,形容詞,動詞
  • 詞義-來自銀行的詞義歧義消除的輸出-金融機構,堆
  • 本體信息-前哺乳動物,位置
  • n-gram-前好孩子
  • 頭詞-表演的行為根詞

我的問題是如何將它們表示為實數值。我應該只是選擇每個特征(POS,感測等)(即布爾向量)的出現,但是在n元語法的情況下語義信息將會丟失(在情感分析的情況下,非常好的男孩和好男孩具有不同的語義傾向)。

沒有將標稱值轉換為實值向量的好方法。 最常見的方法是您所建議的-轉換為布爾向量。 如果是n-gram,我看不出你的意思。 你的目的是什么? 您說您擁有POS,POS是單詞的一個功能,而n-gram在單個單詞級別上沒有意義,而是作為句子部分的表示。 您是說“它出現在哪里”嗎? 然后,它與“前一個單詞”(或n-1個前一個單詞)完全相同,然后您就不會丟失任何信息(因為每個“前一個”單詞都具有k個維,其中k是詞匯的大小)。 請記住,您的代表將是巨大的

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM