如何根据列值在数据框单元格内附加字符串

Question

Given a dataframe:给定一个数据框：

import pandas as pd

df = pd.DataFrame(data= {'Col1': ['No', 'Yes', 'No', 'Maybe'], 'Col2': ['Yes', 'No', 'No', 'No'], 'Result': ''})

I want to populate Result with a list that may need to be appended based upon a column value.我想用一个列表填充Result ，该列表可能需要根据列值进行附加。 In this case, the parameters would be:在这种情况下，参数将是：

If the value is 'Yes' keep the current value of Result , if the value is 'Maybe' append 'Attention needed (insert column name)', if the value is 'No' append 'Failure (insert column name)'如果值为 'Yes' 保留Result的当前值，如果值为 'Maybe' append 'Attention needed (insert column name)'，如果值为 'No' append 'Failure (insert column name)'

Desired result:想要的结果：

Answer 1

Not very pretty, but you could create a dict , then use stack , map and groupby with join aggregation:不是很漂亮，但您可以创建一个dict ，然后将stack 、 map和groupby与join聚合一起使用：

d = {'No': 'Failure', 'Maybe': 'Attention needed'}
s = df[['Col1', 'Col2']].stack().map(d).dropna()

df['Result'] = (s + ' ' + s.index.get_level_values(1)).groupby(level=0).agg(', '.join)

[out] [出去]

    Col1 Col2                               Result
0     No  Yes                         Failure Col1
1    Yes   No                         Failure Col2
2     No   No           Failure Col1, Failure Col2
3  Maybe   No  Attention needed Col1, Failure Col2

Answer 2

Try this one liner code using lambda function:使用lambda函数试试这个单行代码：

df['Result'] = df[['Col1','Col2']].apply(lambda x: 'Failure Col1' if (x[0]=='No' and x[1]=='Yes') else ('Failure Col2' if (x[1]=='No' and x[0]=='Yes') else ('Failure Col1, Failure Col2' if (x[0]=='No' and x[1]=='No') else("Attention needed Col1, Failure Col2" if (x[0]=='Maybe' and x[1]=='No') else None))), axis=1)

Output:输出：


   Col1     Col2    Result
0   No      Yes     Failure Col1
1   Yes     No      Failure Col2
2   No      No      Failure Col1, Failure Col2
3   Maybe   No      Attention needed Col1, Failure Col2

Answer 3

您可以首先将结果列构造为一个 numpy 数组，同时遍历数据框列并检查值，然后您可以添加新的结果列并删除旧的结果列。

Answer 4

Construct a dictionary to replace values in df and Using * and + to construct a series of appropriate message strings and finally join them and assign to df.Result构造一个字典来替换df值并使用*和+构造一系列合适的消息字符串，最后将它们连接起来并赋值给df.Result

d = {'Yes': '', 'No': 'Failure ', 'Maybe': 'Attention needed '}
df1 = df[['Col1', 'Col2']]
df['Result'] = ((df1.replace(d) 
                + df1.ne('Yes').values * df1.columns.values).agg(','.join, axis=1)
                                                            .str.strip(','))

Or或者

df['Result'] = ((df1.replace(d) 
                + df1.ne('Yes').values * (df1.columns+',').values).sum(1)
                                                                  .str.strip(','))

Out[267]:
    Col1 Col2                              Result
0     No  Yes                        Failure Col1
1    Yes   No                        Failure Col2
2     No   No           Failure Col1,Failure Col2
3  Maybe   No  Attention needed Col1,Failure Col2

Here the detail这里的细节

df1.replace(d) + df1.ne('Yes').values * df1.columns.values

Out[268]:
                    Col1          Col2
0           Failure Col1
1                         Failure Col2
2           Failure Col1  Failure Col2
3  Attention needed Col1  Failure Col2

((df1.replace(d) + df1.ne('Yes').values * df1.columns.values).agg(','.join, axis=1)
                                                             .str.strip(','))

Out[269]:
0                          Failure Col1
1                          Failure Col2
2             Failure Col1,Failure Col2
3    Attention needed Col1,Failure Col2
dtype: object

如何根据列值在数据框单元格内附加字符串

问题描述

4 个解决方案

解决方案1
1 2020-03-11 21:16:15

解决方案2
1 2020-03-11 21:21:50

解决方案3
0 2020-03-11 21:03:52

解决方案4
0 2020-03-11 22:32:51

如何根据列值在数据框单元格内附加字符串

问题描述

4 个解决方案

解决方案1 1 2020-03-11 21:16:15

解决方案2 1 2020-03-11 21:21:50

解决方案3 0 2020-03-11 21:03:52

解决方案4 0 2020-03-11 22:32:51

解决方案1
1 2020-03-11 21:16:15

解决方案2
1 2020-03-11 21:21:50

解决方案3
0 2020-03-11 21:03:52

解决方案4
0 2020-03-11 22:32:51