pandas：计算列表中每个元素在列表列中唯一出现的次数

Question

我有一个包含一列列表的 dataframe 如下：

df
     pos_tag
0    ['Noun','verb','adjective']
1    ['Noun','verb']
2    ['verb','adjective']
3    ['Noun','adverb']
...

我想得到的是每个唯一元素作为字典出现在整个列中的次数：

desired output:
my_dict = {'Noun':3, 'verb':3, 'adjective':2, 'adverb':1}

Answer 1

使用Series.explode以及Series.value_counts和Series.to_dict ：

freq = df['pos_tag'].explode().value_counts().to_dict()

结果：

# print(freq)
{'Noun':3, 'verb':3, 'adjective':2, 'adverb':1}

Answer 2

为了提高性能，请使用带有嵌套列表扁平值的Counter ：

from collections import Counter

my_dict = dict(Counter([y for x in df['pos_tag'] for y in x]))
print (my_dict)
{'Noun': 3, 'verb': 3, 'adjective': 2, 'adverb': 1}

pandas：计算列表中每个元素在列表列中唯一出现的次数

问题描述

2 个解决方案

解决方案1
2 已采纳 2020-06-29 08:46:13

解决方案2
1 2020-06-29 08:44:02

pandas：计算列表中每个元素在列表列中唯一出现的次数

问题描述

2 个解决方案

解决方案1 2 已采纳 2020-06-29 08:46:13

解决方案2 1 2020-06-29 08:44:02

解决方案1
2 已采纳 2020-06-29 08:46:13

解决方案2
1 2020-06-29 08:44:02