如何在 pandas dataframe 中的列內操作列表名稱

Question

我有一個 DataFrame：

               RR                    AA                  SS         LL
 C1     [C1, C2, C3, C4, C5]        [C1]                [C1]    
 C2     [C2, C3, C5]            [C1, C2, C3, C5]    [C5, C3, C2]    I
 C3     [C2, C3, C4, C5]        [C1, C2, C3, C5]    [C5, C3, C2]    
 C4           [C4]              [C1, C3, C4, C5]        [C4]        I
 C5     [C2, C3, C4, C5]        [C1, C2, C3, C5]    [C5, C3, C2]

我想刪除具有 LL I的整行，即C2和C4行還需要從RR 、 AA和SS中的剩余行列表中刪除元素C2和C4 ，這樣 output 應該是這樣的：

            RR               AA            SS         LL
 C1     [C1, C3, C5]        [C1]          [C1]  
 C3     [C3, C5]        [C1, C3, C5]    [C5, C3]    
 C5     [C3, C5]        [C1, C3, C5]    [C5, C3]

我嘗試了這段代碼，但它只從RR 、 AA和SS的列表元素中刪除了不是C2和C4的行。

ix = df.RS.apply(set) == df.IS.apply(set)
df.loc[~ix]

我得到這樣的 output，其中RR 、 AA和SS 、 C2和C4出現在我不需要的列表中。

               RR                    AA                  SS         LL
 C1     [C1, C2, C3, C4, C5]        [C1]                [C1]    
 C3     [C2, C3, C4, C5]        [C1, C2, C3, C5]    [C5, C3, C2]    
 C5     [C2, C3, C4, C5]        [C1, C2, C3, C5]    [C5, C3, C2]

Answer 1

這應該這樣做：

new_df = df.loc[df['LL'] != 'I', ['RR', 'AA', 'SS']].applymap(set).apply(lambda col: col - {'C2', 'C4'}).applymap(list)

Output：

>>> new_df
              RR            AA        SS
C1  {C5, C3, C1}          {C1}      {C1}
C3      {C5, C3}  {C1, C5, C3}  {C5, C3}
C5      {C5, C3}  {C1, C5, C3}  {C5, C3}

Answer 2

col1 = ['C1','C2','C3','C4','C5']
RR = [['C1', 'C2', 'C3', 'C4', 'C5'], ['C2', 'C3', 'C5'], ['C2', 'C3', 'C4', 'C5'], 
        ['C4'], ['C2', 'C3', 'C4', 'C5']]
AA = [['C1'], ['C1', 'C2', 'C3', 'C5'], ['C1', 'C2', 'C3', 'C5'], ['C1', 'C3', 'C4', 'C5'], 
        ['C1', 'C2', 'C3', 'C5']]
SS = [['C1'], ['C5', 'C3', 'C2'], ['C5', 'C3', 'C2'], ['C4'], ['C5', 'C3', 'C2']]
LL = ['','I','','I','']

df1 = pd.DataFrame({'col1':col1, 'RR':RR,'AA':AA, 'SS':SS, 'LL':LL})

removing_row = df1.loc[df1['LL'] == 'I', 'col1']
removing_index = list(removing_row.index)
removing_values = removing_row.values

df1.drop(df1.index[removing_index], inplace=True, axis=0)

for col in ['RR','AA','SS']:
    for i,j in df1[col].iteritems():
        for k in removing_values:
            if k in j:
                j.remove(k)
        df1[col][i] = j

print(df1)

如何在 pandas dataframe 中的列內操作列表名稱

問題描述

2 個解決方案

解決方案1
1 已采納

解決方案2
0 2022-03-14 18:15:45

如何在 pandas dataframe 中的列內操作列表名稱

問題描述

2 個解決方案

解決方案1 1 已采納

解決方案2 0 2022-03-14 18:15:45

解決方案1
1 已采納

解決方案2
0 2022-03-14 18:15:45