pandas 數據框中所有列的基數/不同計數

Question

雖然 dataframe.describe() 對一些摘要描述統計很有用 - 特別是四分位數和范圍值 - 它顯然沒有基數計數選項？

有哪些選項 - 或者替代方法- 用於獲取數據框中的基數計數 - 可能通過提供列列表並默認為“全部”？

Answer 1

您可以計算數據幀系列的不同值。 這將為您提供列名和基數。 例如對於數據框：

names = pd.Categorical(['Tomba', 'Monica', 'Monica', 'Nancy', 'Neil', 'Chris'])
courses = pd.Categorical(['Physics', 'Geometry', 'Physics', 'Biology', 'Algebra', 'Algebra'])

df = pd.DataFrame({
    'Name' : names, 
    'Course': courses
})


Out[72]: df
     Course    Name
0   Physics   Tomba
1  Geometry  Monica
2   Physics  Monica
3   Biology   Nancy
4   Algebra    Neil
5   Algebra   Chris

df.apply(pd.Series.nunique)

Course    4
Name      5
dtype: int64

Answer 2

或者，您可以使用value_counts 。 這是一個例子。

import pandas as pd

names = pd.Categorical(['Tomba', 'Monica', 'Monica', 'Nancy', 'Neil', 'Chris'])
courses = pd.Categorical(['Physics', 'Geometry', 'Physics', 'Biology', 'Algebra', 'Algebra'])
df = pd.DataFrame({'Name': names, 'Course': courses})

for col in df:
    cardinality = len(pd.Index(df[col]).value_counts())
    print(df[col].name + ": " + str(cardinality))

pandas 數據框中所有列的基數/不同計數

問題描述

2 個解決方案

解決方案1
10 已采納 2017-10-10 22:01:24

解決方案2
3 2020-01-06 19:12:37

pandas 數據框中所有列的基數/不同計數

問題描述

2 個解決方案

解決方案1 10 已采納 2017-10-10 22:01:24

解決方案2 3 2020-01-06 19:12:37

解決方案1
10 已采納 2017-10-10 22:01:24

解決方案2
3 2020-01-06 19:12:37