簡體   English   中英

計算每列的不同值,返回數據框,並對值進行排序

[英]Count distinct values for each column, return a dataframe, and sort values

這是我的代碼:

for column in list(data.columns):
    pd.DataFrame(columns=column, data=data.columns.nunique()).sort_values()

這行不通......

定義函數還是使用for循環,如何使檢查每一列的唯一值編號變得簡單?

您的代碼有很多問題,但有兩個主要問題:

  • 您不存儲,打印或將創建的pd.DataFrame對象添加到列表中。
  • 您將nunique應用於列標簽,而不是數據nunique的數據。

在這里,您可以直接在數據nunique使用nunique ,然后再使用sort_values

np.random.seed(0)
df = pd.DataFrame(np.random.randint(0, 10, (5, 5)))

res = df.nunique()\
        .sort_values(ascending=False)\
        .rename('Count')\
        .to_frame()

print(res)

   Count
1      5
3      4
2      4
0      4
4      3

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM