[英]Sort Pandas Dataframe by substrings of a column
給定一個DataFrame:
name email
0 Carl carl@yahoo.com
1 Bob bob@gmail.com
2 Alice alice@yahoo.com
3 David dave@hotmail.com
4 Eve eve@gmail.com
如何根據電子郵件的域名(按字母順序,按升序排序)進行排序,然后在每個域組內根據“@”之前的字符串進行排序?
排序上面的結果應該是:
name email
0 Bob bob@gmail.com
1 Eve eve@gmail.com
2 David dave@hotmail.com
3 Alice alice@yahoo.com
4 Carl carl@yahoo.com
使用:
df = df.reset_index(drop=True)
idx = df['email'].str.split('@', expand=True).sort_values([1,0]).index
df = df.reindex(idx).reset_index(drop=True)
print (df)
name email
0 Bob bob@gmail.com
1 Eve eve@gmail.com
2 David dave@hotmail.com
3 Alice alice@yahoo.com
4 Carl carl@yahoo.com
說明 :
drop=True
reset_index
split
值split
為新的DataFrame
和sort_values
reindex
新訂單 選項1
sorted
+ reindex
df = df.set_index('email')
df.reindex(sorted(df.index, key=lambda x: x.split('@')[::-1])).reset_index()
email name
0 bob@gmail.com Bob
1 eve@gmail.com Eve
2 dave@hotmail.com David
3 alice@yahoo.com Alice
4 carl@yahoo.com Carl
選項2
sorted
+ pd.DataFrame
作為替代方案,您可以通過重新創建新的DataFrame來放棄來自選項1的reindex
調用。
pd.DataFrame(
sorted(df.values, key=lambda x: x[1].split('@')[::-1]),
columns=df.columns
)
name email
0 Bob bob@gmail.com
1 Eve eve@gmail.com
2 David dave@hotmail.com
3 Alice alice@yahoo.com
4 Carl carl@yahoo.com
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.