按特定列對 pandas df 行子集（組內）進行排序

Question

我有以下 dataframe 假設：

df


A B C D E
z k s 7 d
z k s 6 l
x t r 2 e
x t r 1 x
u c r 8 f
u c r 9 h
y t s 5 l
y t s 2 o

我想根據每個子行的列 D 對它進行排序（例如，在這種情況下具有相同的列 A、B 和 C）

預期的 output 將是：

df


A B C D E
z k s 6 l
z k s 7 d
x t r 1 x
x t r 2 e
u c r 8 f
u c r 9 h
y t s 2 o
y t s 5 l

對這種操作有什么幫助嗎？

Answer 1

我認為它應該像這樣簡單：

df = df.sort_values(["A", "B", "C", "D"])

Answer 2

您可以使用 groupby 和 sort 值（也歸功於@Henry Ecker 的評論）：

df.groupby(['A','B','C'],group_keys=False,sort=False).apply(pd.DataFrame.sort_values,'D')

output：

    A   B   C   D   E
1   z   k   s   6   l
0   z   k   s   7   d
3   x   t   r   1   x
2   x   t   r   2   e
4   u   c   r   8   f
5   u   c   r   9   h
7   y   t   s   2   o
6   y   t   s   5   l

Answer 3

讓我們嘗試ngroup創建幫助 col

df['new1'] = df.groupby(['A','B','C'],sort=False).ngroup()
df = df.sort_values(['new1','D']).drop('new1',axis=1)
df
   A  B  C  D  E
1  z  k  s  6  l
0  z  k  s  7  d
3  x  t  r  1  x
2  x  t  r  2  e
4  u  c  r  8  f
5  u  c  r  9  h
7  y  t  s  2  o
6  y  t  s  5  l

Answer 4

dic = {
    'A': [*'zzxxuuyy'],
    'B': [*'kkttcctt'],
    'C': [*'ssrrrrss'],
    'D': [*map(int, '76218952')],
    'E': [*'dlexfhlo']
}
df = pd.DataFrame(dic)

df.groupby(['A', 'B']).apply(lambda df: df.sort_values('D')).droplevel(['A', 'B']).reset_index()

如果您想根據列“A”、“B”、“C”、“E”進行排序，那么您必須：

df.groupby(['A', 'B', 'D', 'E']).apply(lambda df: df.sort_values('D')).droplevel(['A', 'B', 'D', 'E']).reset_index()

按特定列對 pandas df 行子集（組內）進行排序

問題描述

4 個解決方案

解決方案1
5 已采納 2021-06-05 01:23:24

解決方案2
2 2021-06-05 00:54:31

解決方案3
2 2021-06-05 02:21:11

解決方案4
1 2021-06-05 01:36:38

按特定列對 pandas df 行子集（組內）進行排序

問題描述

4 個解決方案

解決方案1 5 已采納 2021-06-05 01:23:24

解決方案2 2 2021-06-05 00:54:31

解決方案3 2 2021-06-05 02:21:11

解決方案4 1 2021-06-05 01:36:38

解決方案1
5 已采納 2021-06-05 01:23:24

解決方案2
2 2021-06-05 00:54:31

解決方案3
2 2021-06-05 02:21:11

解決方案4
1 2021-06-05 01:36:38