熊貓：在一個數據框中創建新列，並根據與另一個數據框中的匹配鍵進行匹配

Question

我有兩個pandas數據框，第一個數據框有兩個列假定為鍵和值，第二個數據框僅包含鍵，我想在第二個數據框中添加新列，此列的值應為與第一個數據幀匹配的鍵

df = pd.DataFrame({'vi' : ['a','b','c','d','e'],'s':[2,5,7,0,1]})  
tf = pd.DataFrame({'vi' : ['b','d','c','a','e']})    
df    

vi  s  
 a  2  
 b  5  
 c  7  
 d  0  
 e  1  

tf  

vi    
 b  
 d  
 c  
 a  
 e  

result tf  

vi  s  
 b  5  
 d  0  
 c  7  
 a  2  
 e  1

Answer 1

合並時，您需要指定left以確保tf中的所有值都包含在新數據框中。 由於兩個數據框的鍵列名稱相同，因此請指定on='vi' 。

df = pd.DataFrame({'vi': ['a', 'b', 'c', 'd', 'e', 'z'],
                   's': [2, 5, 7, 0, 1, 10]})  
tf = pd.DataFrame({'vi': ['b', 'd', 'c', 'a', 'e', 'f']})

>>> tf.merge(df, how='left', on='vi')
  vi   s
0  b   5
1  d   0
2  c   7
3  a   2
4  e   1
5  f NaN

我已經將兩個數據集擴展為一個非唯一值。 請注意，上面的結果與簡單的合並有何不同，默認情況下，簡單的合並會進行內部聯接。

>>> tf.merge(df)
  vi  s
0  b  5
1  d  0
2  c  7
3  a  2
4  e  1

Answer 2

您可以使用tf.merge(df) 將 tf與df 合並，示例如下：

In [1]: import pandas as pd

In [2]: df = pd.DataFrame({'vi' : ['a','b','c','d','e'],'s':[2,5,7,0,1]})  

In [3]: tf = pd.DataFrame({'vi' : ['b','d','c','a','e']}) 

In [4]: tf = tf.merge(df)

In [5]: tf
Out[5]: 
  vi  s
0  b  5
1  d  0
2  c  7
3  a  2
4  e  1

這是您想要的結果。

Answer 3

將列附加到數據框后，行索引由索引確定。

您可以使用

df = pd.DataFrame({'s':[2,5,7,0,1]})  
df.index = ['a','b','c','d','e']

默認情況下，索引是從0到N-1的整數范圍。

熊貓：在一個數據框中創建新列，並根據與另一個數據框中的匹配鍵進行匹配

問題描述

3 個解決方案

解決方案1
4 2015-12-22 05:38:53

解決方案2
2 2015-12-22 05:02:40

解決方案3
0 2015-12-22 05:17:31

熊貓：在一個數據框中創建新列，並根據與另一個數據框中的匹配鍵進行匹配

問題描述

3 個解決方案

解決方案1 4 2015-12-22 05:38:53

解決方案2 2 2015-12-22 05:02:40

解決方案3 0 2015-12-22 05:17:31

解決方案1
4 2015-12-22 05:38:53

解決方案2
2 2015-12-22 05:02:40

解決方案3
0 2015-12-22 05:17:31