按另一列的順序對包含NA的一列中的值進行排序

Question

我在熊貓中有一個數據框

import pandas as pd

df=pd.DataFrame.from_dict({'col1':['A_2','A_1','A_3','A_4','A_6','A_5','A_8','A_7'],
'col2':['NaN','A_2','A_3','A_4','A_5','NaN','A_1','A_6']}, orient='index').T

我想更改第二列col2的順序並更改它，以使兩列中相同的項目像這樣匹配：

       col1     col2
   0    A_2     A_2
   1    A_1     A_1
   2    A_3     A_3
   3    A_4     A_4
   4    A_6     A_6
   5    A_5     A_5
   6    A_7     NaN
   7    A_8     NaN

嘗試： df.iloc[:,1].sort_values(df.iloc[:,0])僅返回有關不可散列序列的錯誤消息

現在假設有兩個數據框：

DF1：

df1=pd.DataFrame({'col1':['A_2','A_1','A_3','A_4','A_6','A_5','A_8','A_7'],
'col2':[0,1,1,0,0,1,1,0], 'col3':[1,6,7,5,4,3,9,8]})

df2=pd.DataFrame({'N1':['NaN','A_2','A_3','A_4','A_5','NaN','A_1','A_6'],
             'N2':['NaN',0,1,2,3,'NaN',0,1], 'N3':['NaN',0,0,0,0,'NaN',0,0]})

我想像上面那樣排序，但是這次， df2所有列和行：

輸出：

N1    N2    N3
A_2   0     0
A_1   0     0
A_3   1     0
A_4   2     0
A_6   1     0
A_5   3     0
NaN   NaN   NaN
NaN   NaN   NaN

Answer 1

如果我理解正確的話，你可以重寫col2與價值觀col1當他們存在col2 ：

df.col2 = df.col1[df.col1.isin(df.col2)]

結果：

df
Out[13]: 
  col2 col1
0  A_2  A_2
1  A_1  A_1
2  A_3  A_3
3  A_4  A_4
4  A_6  A_6
5  A_5  A_5
6  NaN  A_8
7  NaN  A_7

編輯：擴展問題與兩個數據框

這隱含地假定df2.N1中的值是唯一的（ NaN值除外）。 因此，我們可以將它們用作索引，以從N2和N3獲得相應的值。 然后，我們可以使用df1.col1作為索引值：

In[53] : df2.set_index('N1', drop=False).loc[df1.col1]
Out[53]: 
      N1   N2   N3
N1                
A_2  A_2    0    0
A_1  A_1    0    0
A_3  A_3    1    0
A_4  A_4    2    0
A_6  A_6    1    0
A_5  A_5    3    0
A_8  NaN  NaN  NaN
A_7  NaN  NaN  NaN

您始終可以添加.reset_index(drop=True)來重置索引。

按另一列的順序對包含NA的一列中的值進行排序

問題描述

1 個解決方案

解決方案1
2 已采納 2016-05-24 15:42:19

按另一列的順序對包含NA的一列中的值進行排序

問題描述

1 個解決方案

解決方案1 2 已采納 2016-05-24 15:42:19

解決方案1
2 已采納 2016-05-24 15:42:19