根据条件将一个 dataframe 中的列值设置为另一个 dataframe 列

Question

I have a dataframe df1 :-我有一个 dataframe df1 :-

id ID	Group团体	Family家庭	Bonus奖金
1 1	tri23_1 tri23_1	Laavin拉文	A一个
2 2	hsgç_T2 hsgç_T2	Grendy格兰迪	B乙
3 3	bbbj-1Y_jn bbbj-1Y_jn	Fantol凡多尔	C C
4 4	hsgç_T2 hsgç_T2	Gondow贡多	D D

and have a dataframe df2 :-并有一个 dataframe df2 :-

id ID	Group团体	Family家庭	Bonus奖金
1 1	tri三	Brendy布伦迪	B乙
2 2	hsgç_T2 hsgç_T2	Fantol凡多尔	A一个
5 5	bbbj-1Y_jn bbbj-1Y_jn	Fantol凡多尔	E乙
6 6	hsgç_T3 hsgç_T3	Gondow贡多	D D

For id in df1 that are present in df2 ,I want to set Group , Family , Bonus columns alone of df2 in df1 .对于df2中存在的df1中的id ，我想在df1中单独设置df2的Group 、 Family 、 Bonus列。 Expected df1 :-预期df1 ：-

id ID	Group团体	Family家庭	Bonus奖金
1 1	tri三	Brendy布伦迪	B乙
2 2	hsgç_T2 hsgç_T2	Fantol凡多尔	A一个
3 3	bbbj-1Y_jn bbbj-1Y_jn	Fantol凡多尔	C C
4 4	hsgç_T2 hsgç_T2	Gondow贡多	D D

Answer 1

shared_columns = ['Group', 'Family', 'Bonus']

replacements = (pd.merge(df1, df2, on='id', how='left')
                  .iloc[:, -len(shared_columns):])
replacements.columns = shared_columns

df1.update(replacements)

Example:例子：

df1 = pd.DataFrame([[1,  1, 0.1, 1], 
                    [2,  2, 0.2, 2], 
                    [3,  3, 0.3, 3]], 
                   columns=['id', 'Group', 'Family', 'Bonus'])
df2 = pd.DataFrame([[3,  30, 300, 3], 
                    [1,  10, 100, 1], 
                    [4,  40, 400, 4]], 
                   columns=['id', 'Group', 'Family', 'Bonus'])

df1 : df1 ：

   id  Group  Family  Bonus
0   1      1     0.1      1
1   2      2     0.2      2
2   3      3     0.3      3

df2 : df2 ：

   id  Group  Family  Bonus
0   3     30     300      3
1   1     10     100      1
2   4     40     400      4

pd.merge(df1, df2, on='id', how='left' performs a left-merge, on the column id : pd.merge(df1, df2, on='id', how='left'在列id上执行左合并：

   id  Group_x  Family_x  Bonus_x  Group_y  Family_y  Bonus_y
0   1        1       0.1        1     10.0     100.0      1.0
1   2        2       0.2        2      NaN       NaN      NaN
2   3        3       0.3        3     30.0     300.0      3.0

replacements (after selecting the last columns, and renaming them): replacements （在选择最后一列并重命名它们之后）：

   Group  Family  Bonus
0   10.0   100.0    1.0
1    NaN     NaN    NaN
2   30.0   300.0    3.0

Resulting df1 :结果df1 ：

   id  Group  Family  Bonus
0   1   10.0   100.0    1.0
1   2    2.0     0.2    2.0
2   3   30.0   300.0    3.0

Answer 2

if setting index on DF is acceptable, then this is one way to accomplish it.如果在 DF 上设置索引是可以接受的，那么这是实现它的一种方法。 Using update使用更新

df.set_index('id', inplace=True)
df.update(df2.set_index('id'))
df

    Group       Family  Bonus
id          
1   tri         Brendy  B
2   hsgç_T2     Fantol  A
3   bbbj-1Y_jn  Fantol  C
4   hsgç_T2     Gondow  D

根据条件将一个 dataframe 中的列值设置为另一个 dataframe 列

问题描述

2 个解决方案

解决方案1
1 2022-08-23 17:13:23

解决方案2
0 2022-08-23 18:16:19

根据条件将一个 dataframe 中的列值设置为另一个 dataframe 列

问题描述

2 个解决方案

解决方案1 1 2022-08-23 17:13:23

解决方案2 0 2022-08-23 18:16:19

解决方案1
1 2022-08-23 17:13:23

解决方案2
0 2022-08-23 18:16:19