如何刪除特定條件的值並替換它們？

Question

我的 dataframe 看起來像這樣：

ID	第一的	第二	第四	第五
1	一	一	二	三
2	一	二	二	三
3	一	三	三	三
4	一	一	一	一
5	一	一	二	一

代碼：

df = {'ID': [1, 2, 3, 4, 5],
        'first': ['one', 'one', 'one', 'one', 'one']
'second': ['one', 'two', 'three','one','one']
'fourth': ['two', 'two', 'three','one','two']
'fifth': ['three','three','three','one', 'one']
        }

我也想在一行中刪除/刪除出現在下一列（右）中的那些值。 所以有很多重復，但是如果在一個相同的值之間有另一個值，比如“ID”5，那么應該只刪除第二列的值，這樣 df 最終看起來像這樣：

ID	第一的	第二	第四	第五
1	一	二	三	鈉
2	一	二	三	鈉
3	一	三	鈉	鈉
4	一	鈉	鈉	鈉
5	一	二	一	鈉

Answer 1

您可以使用每行的drop_duplicates並重新索引：

out = (df
 .set_index('ID')
 .apply(lambda s: (s2:=s.drop_duplicates())
                  .set_axis(s.index[:len(s2)]),
        axis=1)
 .reset_index().reindex(df.columns, axis=1)
)

output：

   ID first second fourth  fifth
0   1   one    Two  Three    NaN
1   2   one    Two  Three    NaN
2   3   one  Three    NaN    NaN
3   4   one    NaN    NaN    NaN
4   5   one    two    NaN    NaN

Answer 2

你可以做shift然后使用 NaN 替換相同

out = df.where(lambda x : df.ne(df.shift(1,axis=1))).transform(lambda x: sorted(x, key=pd.isnull),1)
Out[73]: 
  ID first second fourth fifth
0  1   one    Two  Three   NaN
1  2   one    Two  Three   NaN
2  3   one  Three    NaN   NaN
3  4   one    NaN    NaN   NaN
4  5   one    two    one   NaN

如何刪除特定條件的值並替換它們？

問題描述

2 個解決方案

解決方案1
1 2022-08-24 14:43:08

解決方案2
1 2022-08-24 14:52:33

ID	第一的	第二	第四	第五
1	一	一	二	三
2	一	二	二	三
3	一	三	三	三
4	一	一	一	一
5	一	一	二	一

ID	第一的	第二	第四	第五
1	一	二	三	鈉
2	一	二	三	鈉
3	一	三	鈉	鈉
4	一	鈉	鈉	鈉
5	一	二	一	鈉

ID	第一的	第二	第四	第五
1	一	一	二	三
2	一	二	二	三
3	一	三	三	三
4	一	一	一	一
5	一	一	二	一

ID	第一的	第二	第四	第五
1	一	二	三	鈉
2	一	二	三	鈉
3	一	三	鈉	鈉
4	一	鈉	鈉	鈉
5	一	二	一	鈉

如何刪除特定條件的值並替換它們？

問題描述

2 個解決方案

解決方案1 1 2022-08-24 14:43:08

解決方案2 1 2022-08-24 14:52:33

解決方案1
1 2022-08-24 14:43:08

解決方案2
1 2022-08-24 14:52:33

ID	第一的	第二	第四	第五
1	一	一	二	三
2	一	二	二	三
3	一	三	三	三
4	一	一	一	一
5	一	一	二	一

ID	第一的	第二	第四	第五
1	一	二	三	鈉
2	一	二	三	鈉
3	一	三	鈉	鈉
4	一	鈉	鈉	鈉
5	一	二	一	鈉