簡體   English   中英

關於情緒分析的問題

[英]question on sentiment analysis

關於我需要幫助的情緒分析,我有一個問題。

現在,我收到了一些我通過twitter搜索API收集的推文。 因為我使用了我的搜索詞,所以我知道我想要查看的主題或實體(人名)是什么。 我想知道其他人對這些人的看法。

首先,我下載了一個具有已知效價/情緒分數的英語單詞列表,並根據推文中這些單詞的可用性計算情緒(+/-)。 問題是情緒以這種方式計算 - 我實際上更多地關注推文的語氣,而不是關於這個人。

例如,我有這條推文:

 "lol... Person A is a joke. lmao!" 

消息顯然是積極的,但A人應該是消極的。

為了改善我的情緒分析,我可以考慮我的單詞列表中的否定和修飾符。 但是我怎樣才能得到我的情緒分析來看待信息的主題(可能是諷刺)呢?

如果有人能引導我走向某些資源,那就太棒了......

在等待AI領域研究人員的答案時,我會給你一些關於你能快速做些什么的線索。

即使這個主題需要自然語言處理,機器學習甚至心理學方面的知識,你也不必從頭開始,除非你絕望或不信任該領域正在進行的研究質量。

情感分析的一種可能方法是將其視為監督學習問題,其中您有一些小型培訓語料庫,其中包括人工注釋(后來有關)和測試語料庫,您可以在其上測試您的方法/系統的執行情況。 對於訓練,您將需要一些分類器,如SVM,HMM或其他一些分類器,但要保持簡單。 我會從二進制分類開始:好,壞。 您可以對連續的意見范圍進行相同的操作,從正面到負面,即獲得排名,如谷歌,其中最有價值的結果排在最前面。

對於開始檢查libsvm分類器 ,它能夠進行分類{好,壞}和回歸(排名)。 注釋的質量會對您獲得的結果產生巨大影響,但是從哪里獲得它?

我找到了一個關於餐館情感分析的項目 有數據和代碼,因此您可以看到他們如何從自然語言中提取特征以及在分類或回歸中得分較高的特征。 該語料庫包括客戶對他們最近訪問過的餐館的意見,並提供有關食品,服務或氛圍的一些反饋。 關於他們的意見和數字世界的聯系以他們給餐館的星星數量表示。 您在一個網站上擁有自然語言,在另一個網站上擁有餐廳的價格。

看一下這個例子,您可以針對所述問題設計自己的方法。 看看nltk也是如此。 使用nltk,您可以進行部分語音標記,並且運氣也可以獲得名稱。 完成后,您可以向分類器添加一個功能,如果在n個單詞內(跳過n-gram),會有一個分數給一個名稱,有表達意見的單詞(查看餐館語料庫)或使用您已經擁有的權重,但它是最好依靠一個班主來學習重量,這是他的工作。

在當前的技術狀態下,這是不可能的。

英語(和任何其他語言) 非常復雜,無法通過程序“解析”。 為什么? 因為一切都必須是特殊的。 說某人是個笑話是一個笑話的特例,這是你程序中的另一個例外。 Etcetera等等

一個很好的例子(由ScienceFriction發布在這里的SO):

同樣,情感詞“不可預測”在驚悚片的背景下可能是積極的,但在描述豐田的休息系統時則是消極的。

如果你願意在這個問題上花費+/- 40年的時間,那么請繼續,非常感謝:)

我並不完全同意夜間爆竹的說法。 我同意這是一個難題,但我們正朝着解決方案取得良好進展。

例如,“詞性”可以幫助您找出句子中的主語,動詞和賓語。 並且'n-gram'可以幫助你在豐田與驚悚的例子中找出背景。 看看TagHelperTools 它建立在weka之上,提供詞性和n-gram標記。

盡管如此,很難獲得OP想要的結果,但它不會花費40年。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM