pandas df 在多列上應用條件

Question

我有一個看起來像這樣的df：

pd.DataFrame.from_dict({'master_feature':['ab',float('NaN'),float('NaN')],
    'feature':[float('NaN'),float('NaN'),'pq'],
    'epic':[float('NaN'),'fg',float('NaN')]})

我想創建一個名為從 master_feature、epic 和 feature 列中promoted的新列：

promoted的價值將是：

如果相鄰的master_feature列值不是 null，則master feature 。
如果相鄰feature列的值不是 null，則feature ，對於epic也是如此

就像是：

df.promoted = 'master feature' if not pd.isnull(df.master_feature) 
               elseif 'feature' if not pd.isnull(df.feature) 
               elseif 'epic' pd.isnull(df.epic) 
               else 'Na'

如何使用df.apply實現這一目標？ 如果我使用np.select會更有效嗎？

Answer 1

np.select是通往 go 的方式。 下面試試。 . . 我想我根據你的問題得到了正確的邏輯。 此外，您的邏輯存在一些差異：“如果相鄰特征列值不是 null，並且對於史詩，則特征”與“elseif 'epic' pd.isnull(df.epic)”不同所以我選擇了 if df['epic'] is not null then 'epic'讓我知道這是否正確。

cond = [~df['master_feature'].isna(), # if master_feater is not null then 'master feater'
        ~df['feature'].isna(), # if feature is not null then 'feature
        ~df['epic'].isna()] # if epic is not null then 'epic'

choice = ['master feature', 
          'feature', 
          'epic']

df['promoted'] = np.select(cond, choice, np.nan)

  master_feature feature epic        promoted
0             ab     NaN  NaN  master feature
1            NaN     NaN   fg            epic
2            NaN      pq  NaN         feature

Answer 2

可以通過apply()和 numpy argmin argmin()的組合來完成

df = pd.DataFrame.from_dict({'master_feature':['ab',float('NaN'),float('NaN')],
    'feature':[float('NaN'),float('NaN'),'pq'],
    'epic':[float('NaN'),'fg',float('NaN')]})

df.assign(promoted=lambda dfa: dfa.apply(lambda r: r[np.argmin(r.isna())], axis=1))

pandas df 在多列上應用條件

問題描述

2 個解決方案

解決方案1
1 已采納 2021-01-15 13:44:51

解決方案2
1 2021-01-15 13:59:48

pandas df 在多列上應用條件

問題描述

2 個解決方案

解決方案1 1 已采納 2021-01-15 13:44:51

解決方案2 1 2021-01-15 13:59:48

解決方案1
1 已采納 2021-01-15 13:44:51

解決方案2
1 2021-01-15 13:59:48