繁体 English 中英

医院等候时间的情绪分析

[英]Sentiment analysis for waiting times in hospitals

原文 2019-12-04 18:27:57 1 2 python/ machine-learning/ nlp/ unsupervised-learning

我一直试图从医院患者的评论中推断出及时性评分（基于患者等待时间的评分）。 可用数据是患者的评论和他们对整体体验的评分。 问题是我没有对患者及时评分的标签，而是对整个体验的评分。 像“我已经等了很长时间，但这次经历是值得的”这样的评论具有良好的背景和良好的评级应该会返回一个有点糟糕的及时性分数，同样的事情对于“等待很短但它并不能证明糟糕的合理性”服务'。 因此，撰写评论的人的背景/感觉也很重要。 我已经清理了评论并提取了与等待时间（如果存在）相关的句子的一部分，并使用了 TextBlob 或 VaderSentiment 之类的库来推断患者的情绪是否是积极的。 问题是我有 20% 的情况从不同的图书馆得到不同的结果，而且它们并不总是最有意义（等待时间长但在良好上下文中的评论返回一个很好的等待时间，但它应该在至少保持中立）。我需要某种方式来将句子的上下文和实际评分与他们等待的时间相关联并得出分数，这是一种考虑到整个句子但寻找特定的情绪分析谈论等待时间的上下文。

2 个解决方案

您的问题称为“基于方面的情感分析”。 我不是这方面的专家，但也许这个博客可以帮助您入门-monkeylearn.com/blog/aspect-based-sentiment-analysis

一个有用的解决方案是：

在给定的语料库中应用语义角色标签以找到突出显示的特征
使用Word2Vec-SkipGram等词嵌入技术进行负采样

（想法：相同的词出现在相同的上下文中，因此不需要重新计算相似度。）
通过包围的词（窗口大小）查找特征的情绪。

注意：使用 Sentiment 词典（如SentiWordNet）可能会对您有所帮助。
定义一种方法来获取整体方面级别（突出显示的特征）情绪分析。

例如在二进制分类中：
pos/neg 极性的聚合划分为句子中的特征数量
训练你的模型