簡體   English   中英

在熊貓數據框中訂購一列

[英]Ordering a column in pandas dataframe

我需要創建一個數據框,過濾掉 Nationality 列中五個最常列出的國家以及它們列出的總次數。 我一直在嘗試使用 groupby,但沒有成功。 我用過的代碼

df.groupby(['Nationality']).sum() 

我還需要確定被列為參與該計划的人中至少有一個推薦人的百分比。 我也不確定這個代碼。

這是數據框的一部分

檢查這個問題及其答案,它與您要求的相似。

過濾掉包含在前 5 個國籍中的國籍的行:

df[df['Nationality'].isin(df['Nationality'].value_counts().index[:6]) == False]

通過查看 df 的形狀來查看它們被列出的次數,其中行包含前 5 名的國籍:

df[df['Nationality'].isin(df['Nationality'].value_counts().index[:6])].shape

查看 Number_of_Referalls 值 > 或 = 為 1 的百分比的快速方法:

(df['Number_of_Referalls '] >= 1).value_counts(normalize=True) * 100

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM