按列的子字符串對Pandas Dataframe進行排序

Question

給定一個DataFrame：

    name             email
0   Carl    carl@yahoo.com
1    Bob     bob@gmail.com
2  Alice   alice@yahoo.com
3  David  dave@hotmail.com
4    Eve     eve@gmail.com

如何根據電子郵件的域名（按字母順序，按升序排序）進行排序，然后在每個域組內根據“@”之前的字符串進行排序？

排序上面的結果應該是：

    name             email
0    Bob     bob@gmail.com
1    Eve     eve@gmail.com
2  David  dave@hotmail.com
3  Alice   alice@yahoo.com
4   Carl    carl@yahoo.com

Answer 1

使用：

df = df.reset_index(drop=True)
idx = df['email'].str.split('@', expand=True).sort_values([1,0]).index
df = df.reindex(idx).reset_index(drop=True)
print (df)
    name             email
0    Bob     bob@gmail.com
1    Eve     eve@gmail.com
2  David  dave@hotmail.com
3  Alice   alice@yahoo.com
4   Carl    carl@yahoo.com

說明：

對於唯一的默認索引，首先使用drop=True reset_index
然后split值split為新的DataFrame和sort_values
最后reindex新訂單

Answer 2

選項1
sorted + reindex

df = df.set_index('email')
df.reindex(sorted(df.index, key=lambda x: x.split('@')[::-1])).reset_index()

              email   name
0     bob@gmail.com    Bob
1     eve@gmail.com    Eve
2  dave@hotmail.com  David
3   alice@yahoo.com  Alice
4    carl@yahoo.com   Carl

選項2
sorted + pd.DataFrame
作為替代方案，您可以通過重新創建新的DataFrame來放棄來自選項1的reindex調用。

pd.DataFrame(
    sorted(df.values, key=lambda x: x[1].split('@')[::-1]), 
    columns=df.columns
)

    name             email
0    Bob     bob@gmail.com
1    Eve     eve@gmail.com
2  David  dave@hotmail.com
3  Alice   alice@yahoo.com
4   Carl    carl@yahoo.com

按列的子字符串對Pandas Dataframe進行排序

問題描述

2 個解決方案

解決方案1
3 2018-04-09 07:50:04

解決方案2
3 已采納 2018-04-09 07:54:32

按列的子字符串對Pandas Dataframe進行排序

問題描述

2 個解決方案

解決方案1 3 2018-04-09 07:50:04

解決方案2 3 已采納 2018-04-09 07:54:32

解決方案1
3 2018-04-09 07:50:04

解決方案2
3 已采納 2018-04-09 07:54:32