[英]How to analyze python dataframe and to count how many times a string occurs in a column?
嘗試value_counts
:
input_data.Activity.value_counts()
例:
input_data = pd.DataFrame({'Activity': np.random.choice(['Jogging', 'walking'], 10),
'x':np.random.randn(10)})
>>> input_data
Activity x
0 walking -0.318043
1 walking -0.590098
2 walking -0.146811
3 Jogging 0.530030
4 Jogging 0.292955
5 walking 0.872765
6 walking 1.028513
7 Jogging -1.465817
8 Jogging 0.981183
9 walking -2.780214
>>> input_data.Activity.value_counts()
walking 6
Jogging 4
Name: Activity, dtype: int64
嘗試使用numpy的獨特功能:
import numpy as np
np.unique(input_data['Activity'].values, return_counts=True)
使用input_data.Activity.value_counts()
獲得數據框的“活動”列中的每個唯一值及其出現的總次數。
如果您想要關於唯一值數量,最高值,最高值出現等的更一般性描述,則可以使用input_data.describe()
並查看“活動”列的結果。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.