[英]Plotting sentiment analysis over time in python
我正在嘗試 plot 隨着時間的推移我的情緒分析結果。 該代碼涉及來自論壇的評論。 我的代碼示例如下所示:
Timestamp Sentiment
2021-01-28 21:37:41 Positive
2021-01-28 21:32:10 Negative
2021-01-29 21:30:35 Positive
2021-01-29 21:28:57 Neutral
2021-01-29 21:26:56 Negative
我想 plot 一個折線圖,其中只有 x 軸上時間戳的日期,然后是“情緒”列的值計數的單獨行。 所以總共有 3 行,每個情緒(正面、負面和中性)各有一條,y 軸代表計數。 我想我需要以某種方式使用 groupby() 但我不知道如何。
我的解決方案有點復雜,您可能應該稍后增強圖表以適應您想要的(如堆疊條)。
首先,讓我們將您的 dataframe 時間戳分成日期。
import pandas as pd
import matplotlib.pyplot as plt
example = {'Timestamp':
['2021-01-28 21:37:41', '2021-01-28 21:32:10', '2021-01-29 21:30:35',
'2021-01-29 21:28:57', '2021-01-29 21:26:56'],
'Sentiment':
['Positive', 'Negative', 'Positive', 'Neutral', 'Negative']}
df = pd.DataFrame(example)
df['Timestamp'] = pd.to_datetime(df['Timestamp'])
df['Date'] = df['Timestamp'].dt.date
然后,讓我們按日期分組,並計算唯一值。
grouped = df.groupby(by='Date')['Sentiment'].value_counts()
Output:
Date Sentiment
2021-01-28 Negative 1
Positive 1
2021-01-29 Negative 1
Neutral 1
Positive 1
Name: Sentiment, dtype: int64
這是一個多指標系列。 為了獲得更好的格式,我們可以取消堆疊多索引。
unstacked = grouped.unstack(level=1)
然后,我們可以直接將 plot 放在 object 上,unstacked.plot.bar unstacked.plot.bar()
。 這就是結果。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.