Pandas GroupBy 在一列列表中列出值并找到它们的平均值

Question

我有一个大的 pandas dataframe （1M 行），格式如下：

data = {
    'names': {0: ['Lily', 'Kerry', 'Mona'], 1: ['Kerry', 'Mona'], 2: ['Mona']},
    'sentiment': {0: 10, 1: 2, 2: 0}
}
df = pd.DataFrame(data)
df

                 names  sentiment
0  [Lily, Kerry, Mona]         10
1        [Kerry, Mona]          2
2               [Mona]          0

我想计算名称列中每个唯一名称的平均情绪，结果如下：

   names  sentiment
0   Lily         10
1  Kerry          6
2   Mona          4

唯一名称的数量非常长，因此效率很重要

Answer 1

这需要首先在“名称”列上展开，然后是标准GroupBy.mean() ：

df.explode('names').groupby('names', as_index=False, sort=False).mean()

   names  sentiment
0   Lily         10
1  Kerry          6
2   Mona          4

Pandas GroupBy 在一列列表中列出值并找到它们的平均值

问题描述

1 个解决方案

解决方案1
3 已采纳 2020-06-17 19:15:47

Pandas GroupBy 在一列列表中列出值并找到它们的平均值

问题描述

1 个解决方案

解决方案1 3 已采纳 2020-06-17 19:15:47

解决方案1
3 已采纳 2020-06-17 19:15:47