
[英]Python series where values are lists, get another series with list of indexes correspond to each item list
[英]Creating a labeled series with labels that correspond to each 'color' and values?
我有一个示例 dataframe (df),如下图所示,我想使用 pandas 创建一个系列,其标签对应于每种颜色,以及出现该颜色的条目出现的次数 Z6A8064B55kindDF47C45555C4就像每种颜色的总数一样。 我尝试了以下方法,但是得到了一个系列,其中总行数显示为每种颜色的颜色总和:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
df= pd.read_csv('data_set.txt', index _col=0)
total_count = {_:len(df['type']) for _ in df['type'].unique() }
total_count
当前 Output:
{'red': 12,
'green': 12,
'yellow': 12,
'blue': 12}
但是,显然 dataframe 中的 4 个 colors 中的每一个都没有 12 个条目。 我究竟做错了什么?
数字 | 日期 | 颜色 | 重量 | 温度 | 尺寸 |
---|---|---|---|---|---|
0 | 2021 年 1 月 1 日 | 红色的 | 0.2 | 0.2 | 大的 |
1 | 2021 年 1 月 1 日 | 红色的 | 0.6 | 0.6 | 小的 |
2 | 2021 年 1 月 1 日 | 红色的 | 0.4 | 0.6 | 小的 |
3 | 2021 年 1 月 1 日 | 绿色 | 0.2 | 0.4 | 大的 |
4 | 2021 年 1 月 1 日 | 绿色 | 1 | 1 | 小的 |
5 | 2021 年 1 月 1 日 | 黄色 | 0.4 | 0.4 | 大的 |
6 | 2021 年 1 月 1 日 | 黄色 | 0.1 | 0.2 | 大的 |
7 | 2021 年 1 月 1 日 | 黄色 | 1.3 | 0.5 | 大的 |
8 | 2021 年 1 月 1 日 | 黄色 | 1.5 | 0.5 | 小的 |
9 | 2021 年 1 月 1 日 | 黄色 | 1.5 | 0.5 | 小的 |
10 | 2021 年 1 月 1 日 | 蓝色的 | 0.4 | 0.3 | 大的 |
11 | 2021 年 1 月 1 日 | 蓝色的 | 0.8 | 0.2 | 小的 |
尝试:-
df['color'].value_counts()
Output:-
yellow 5
red 3
green 2
blue 2
Name: color, dtype: int64
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.