遍歷 pandas 數據幀或 groupby object

Question

df_headlines =

我想按date列分組，然后計算-1 、 0和1按日期出現的次數，然后以計數最高的為准，將其用作daily_score 。

我從groupby開始：

df_group = df_headlines.groupby('date')

這將返回一個 groupby object ，鑒於我想在上面做的事情，我不確定如何使用它：

我可以使用以下方法進行迭代嗎？：

for index, row in df_group.iterrows():
    daily_pos = []
    daily_neg = []
    daily_neu = []

Answer 1

正如 Ch3steR 作為評論所暗示的那樣，您可以通過以下方式遍歷您的組：

for name, group in headlines.groupby('date'):
    daily_pos = len(group[group['score'] == 1])
    daily_neg = len(group[group['score'] == -1])
    daily_neu = len(group[group['score'] == 0])

print(name, daily_pos, daily_neg, daily_neu)

對於每次迭代，變量name將包含來自date列的值（例如 4/13/20、4/14/20、5/13/20），變量group將包含日期的所有行的date包含在name變量中。

Answer 2

嘗試：

df_headlines.groupby("date")["score"].nlargest(1).reset_index(level=1, drop=True)

無需循環 - 您將在每組中獲得最常見的score

遍歷 pandas 數據幀或 groupby object

問題描述

2 個解決方案

解決方案1
0 2020-05-14 20:42:44

解決方案2
0 2020-05-14 21:25:15

遍歷 pandas 數據幀或 groupby object

問題描述

2 個解決方案

解決方案1 0 2020-05-14 20:42:44

解決方案2 0 2020-05-14 21:25:15

解決方案1
0 2020-05-14 20:42:44

解決方案2
0 2020-05-14 21:25:15