簡體   English   中英

根據多列的條件從另一個 dataframe 更新列的某些值

[英]Update certain values of a column from another dataframe based on condition of multiple columns

我的數據框1:

id    filler       ent    seg    val     text
1     M,0-10       CP     BEC    20       abc
2     M,10-20      D      BWC    30       abc
3     Y,0-10       CP     CCD    40       abc
4     Y,10-20      D      CFC    50       abc

數據框2:

id    filler       ent    seg    val     text
1     M,0-10       CP     BEC    20       xyz
2     Y,10-20      D      CFC    50       xyz

需要創建一個結果 dataframe:

id    filler       ent    seg    val     text
1     M,0-10       CP     BEC    20       xyz
2     M,10-20      D      BWC    30       abc
3     Y,0-10       CP     CCD    40       abc
4     Y,10-20      D      CFC    50       xyz

它檢查除文本之外的所有列是否具有相同的值,然后通過 dataframe 2 更新 dataframe1 我的 dataframe1 有 100 行,dataframe2 有 20 行。

您可以在 dataframe1 上執行 dataframe2 的左合並,並使用指示符列查找 dataframe1 中需要更新的值。

columns = ['id','filler','ent','seg','val','text']

df1 = pd.DataFrame([
    [1, 'M,0-10','CP','BEC',20, 'abc'],
    [2,'M,10-20','D','BWC',30,'abc'],
    [3,'Y,0-10','CP','CCD',40,'abc'],
    [4,'Y,10-20','D','CFC',50,'abc'],
], columns=columns)

df2 = pd.DataFrame([
    [1,'M,0-10','CP','BEC',20,'xyz'],
    [4,'Y,10-20','D','CFC',50,'xyz'],
], columns=columns)

在 dataframe1 上合並 dataframe2,帶有指示符列

columns_merge = [x for x in columns if x!='text']
updated = df1.merge(df2, on=columns_merge, how='left', indicator=True)

根據指標列比較並設置需要更新的內容。

same = updated['_merge']=='both'
updated.loc[same,'text_x'] = updated.loc[same,'text_y']

刪除和重命名列

updated.drop(columns=['text_y','_merge'], inplace=True)
updated.rename(columns = {'text_x': 'text'}, inplace=True)

更新=

   id   filler ent  seg  val text
0   1   M,0-10  CP  BEC   20  xyz
1   2  M,10-20   D  BWC   30  abc
2   3   Y,0-10  CP  CCD   40  abc
3   4  Y,10-20   D  CFC   50  xyz

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM