大熊貓：根據其他數據框創建數據框列

Question

如果我有兩個像這樣的兩個數據框：

import pandas as pd

df1 = pd.DataFrame({'Type':list('AABAC')})
df2 = pd.DataFrame({'Type':list('ABCDEF'), 'Value':[1,2,3,4,5,6]})

  Type
0    A
1    A
2    B
3    A
4    C

  Type  Value
0    A      1
1    B      2
2    C      3
3    D      4
4    E      5
5    F      6

我想基於df2中的值在df1中添加一列。 df2僅包含唯一值，而df1每個值都有多個條目。 因此，生成的df1應該如下所示：

  Type Value
0    A     1
1    A     1
2    B     2
3    A     1
4    C     3

我的實際數據幀df1很長，因此我需要一些有效的東西（我在一個循環中嘗試過，但這要花很多時間）。

Answer 1

您可以使用to_dict方法從df2創建dict ，然后map結果map到df1 Type列：

replace_dict = dict(df2.to_dict('split')['data'])

In [50]: replace_dict
Out[50]: {'A': 1, 'B': 2, 'C': 3, 'D': 4, 'E': 5, 'F': 6}

df1['Value'] = df1['Type'].map(replace_dict)

In [52]: df1
Out[52]:
  Type  Value
0    A      1
1    A      1
2    B      2
3    A      1
4    C      3

Answer 2

根據要求，我發布了一個使用map的解決方案，而無需創建臨時字典：

In[3]:
df1['Value'] = df1['Type'].map(df2.set_index('Type')['Value'])
df1

Out[3]: 
  Type  Value
0    A      1
1    A      1
2    B      2
3    A      1
4    C      3

這依賴於以下InvalidIndexError: Reindexing only valid with uniquely valued Index objects正在查找的鍵值存在，否則我們將得到KeyError並且df2沒有重復的條目，否則設置索引會引發InvalidIndexError: Reindexing only valid with uniquely valued Index objects

Answer 3

另一種方法是使用基於標簽的索引器loc 。 首先使用Type列的索引使用.set_index ，然后訪問使用df1列，指數恢復到原來用.reset_index ：

df2.set_index('Type').loc[df1['Type'],:].reset_index()

將此用作新的df1或提取“ Value列：

df1['Value'] = df2.set_index('Type').loc[df1['Type'],:].reset_index()['Value']

大熊貓：根據其他數據框創建數據框列

問題描述

3 個解決方案

解決方案1
2 已采納 2016-08-05 09:17:08

解決方案2
2 2017-10-23 09:28:49

解決方案3
0 2017-10-31 10:11:00

大熊貓：根據其他數據框創建數據框列

問題描述

3 個解決方案

解決方案1 2 已采納 2016-08-05 09:17:08

解決方案2 2 2017-10-23 09:28:49

解決方案3 0 2017-10-31 10:11:00

解決方案1
2 已采納 2016-08-05 09:17:08

解決方案2
2 2017-10-23 09:28:49

解決方案3
0 2017-10-31 10:11:00