簡體   English   中英

醫院等候時間的情緒分析

[英]Sentiment analysis for waiting times in hospitals

我一直試圖從醫院患者的評論中推斷出及時性評分(基於患者等待時間的評分)。 可用數據是患者的評論和他們對整體體驗的評分。 問題是我沒有對患者及時評分的標簽,而是對整個體驗的評分。 像“我已經等了很長時間,但這次經歷是值得的”這樣的評論具有良好的背景和良好的評級應該會返回一個有點糟糕的及時性分數,同樣的事情對於“等待很短但它並不能證明糟糕的合理性”服務'。 因此,撰寫評論的人的背景/感覺也很重要。 我已經清理了評論並提取了與等待時間(如果存在)相關的句子的一部分,並使用了 TextBlob 或 VaderSentiment 之類的庫來推斷患者的情緒是否是積極的。 問題是我有 20% 的情況從不同的圖書館得到不同的結果,而且它們並不總是最有意義(等待時間長但在良好上下文中的評論返回一個很好的等待時間,但它應該在至少保持中立)。 我需要某種方式來將句子的上下文和實際評分與他們等待的時間相關聯並得出分數,這是一種考慮到整個句子但尋找特定的情緒分析談論等待時間的上下文。

您的問題稱為“基於方面的情感分析”。 我不是這方面的專家,但也許這個博客可以幫助您入門-monkeylearn.com/blog/aspect-based-sentiment-analysis

一個有用的解決方案是:

  1. 在給定的語料庫中應用語義角色標簽以找到突出顯示的特征
  2. 使用Word2Vec-SkipGram等詞嵌入技術進行負采​​樣

    (想法:相同的詞出現在相同的上下文中,因此不需要重新計算相似度。)

  3. 通過包圍的詞(窗口大小)查找特征的情緒。

    注意:使用 Sentiment 詞典(如SentiWordNet)可能會對您有所幫助。

  4. 定義一種方法來獲取整體方面級別(突出顯示的特征)情緒分析。

    例如在二進制分類中:
    pos/neg 極性的聚合划分為句子中的特征數量

  5. 訓練你的模型

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM