[英]Count distinct values for each column, return a dataframe, and sort values
這是我的代碼:
for column in list(data.columns):
pd.DataFrame(columns=column, data=data.columns.nunique()).sort_values()
這行不通......
定義函數還是使用for循環,如何使檢查每一列的唯一值編號變得簡單?
您的代碼有很多問題,但有兩個主要問題:
pd.DataFrame
對象添加到列表中。 nunique
應用於列標簽,而不是數據nunique
的數據。 在這里,您可以直接在數據nunique
使用nunique
,然后再使用sort_values
:
np.random.seed(0)
df = pd.DataFrame(np.random.randint(0, 10, (5, 5)))
res = df.nunique()\
.sort_values(ascending=False)\
.rename('Count')\
.to_frame()
print(res)
Count
1 5
3 4
2 4
0 4
4 3
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.