繁体   English   中英

熊猫:在一个数据框中创建新列,并根据与另一个数据框中的匹配键进行匹配

[英]Pandas: create new column in one dataframe with values based on matching key from another dataframe

我有两个pandas数据框,第一个数据框有两个列假定为键和值,第二个数据框仅包含键,我想在第二个数据框中添加新列,此列的值应为与第一个数据帧匹配的键

df = pd.DataFrame({'vi' : ['a','b','c','d','e'],'s':[2,5,7,0,1]})  
tf = pd.DataFrame({'vi' : ['b','d','c','a','e']})    
df    

vi  s  
 a  2  
 b  5  
 c  7  
 d  0  
 e  1  

tf  

vi    
 b  
 d  
 c  
 a  
 e  

result tf  

vi  s  
 b  5  
 d  0  
 c  7  
 a  2  
 e  1

合并时,您需要指定left以确保tf中的所有值都包含在新数据框中。 由于两个数据框的键列名称相同,因此请指定on='vi'

df = pd.DataFrame({'vi': ['a', 'b', 'c', 'd', 'e', 'z'],
                   's': [2, 5, 7, 0, 1, 10]})  
tf = pd.DataFrame({'vi': ['b', 'd', 'c', 'a', 'e', 'f']})

>>> tf.merge(df, how='left', on='vi')
  vi   s
0  b   5
1  d   0
2  c   7
3  a   2
4  e   1
5  f NaN

我已经将两个数据集扩展为一个非唯一值。 请注意,上面的结果与简单的合并有何不同,默认情况下,简单的合并会进行内部联接。

>>> tf.merge(df)
  vi  s
0  b  5
1  d  0
2  c  7
3  a  2
4  e  1

您可以使用tf.merge(df) tfdf 合并 ,示例如下:

In [1]: import pandas as pd

In [2]: df = pd.DataFrame({'vi' : ['a','b','c','d','e'],'s':[2,5,7,0,1]})  

In [3]: tf = pd.DataFrame({'vi' : ['b','d','c','a','e']}) 

In [4]: tf = tf.merge(df)

In [5]: tf
Out[5]: 
  vi  s
0  b  5
1  d  0
2  c  7
3  a  2
4  e  1

这是您想要的结果。

将列附加到数据框后,行索引由索引确定。

您可以使用

df = pd.DataFrame({'s':[2,5,7,0,1]})  
df.index = ['a','b','c','d','e']

默认情况下,索引是从0到N-1的整数范围。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM