如果根据数据帧的行和列值满足特定条件，如何获取列标题？

Question

I have a dataframe like this: 我有一个这样的数据框：

col1    x   y   z
A      yes  no  yes
B      no   no  yes
C      no   yes no
D      yes  no  yes
E      no   no  yes
F      yes  yes no

I would like to select data like this, If my criteria is to find all yes for A , I should get [x,z] , ie the values for A which ever is yes 我想选择这样的数据，如果我的标准是找到A所有yes ，我应该得到[x,z] ，即A的值为yes

If B , [z] C should give [y] 如果B ， [z] C应给出[y]

What to do? 该怎么办？

Answer 1

First create index by col1 column for indexing by loc , compare by value and last get index values to list : 首先按col1列创建索引以按loc进行索引，按值进行比较，最后获取要list index值：

df = df.set_index('col1')

def get_val(df, idx, val):
    a = df.loc[idx].eq(val)
    return a.index[a].tolist()

print (get_val(df, 'A', 'yes'))
['x', 'z']

print (get_val(df, 'B', 'yes'))
['z']

print (get_val(df, 'C', 'yes'))
['y']

Answer 2

You could use 你可以用

In [499]: df.eq('yes').dot(df.columns)[df.col1.eq('A')]
Out[499]:
0    xz
dtype: object

In [500]: df.eq('yes').dot(df.columns)[df.col1.eq('B')]
Out[500]:
1    z
dtype: object

In [501]: df.eq('yes').dot(df.columns)[df.col1.eq('C')]
Out[501]:
2    y
dtype: object

Answer 3

Here is another one creating a function: 这是另一个创建函数的函数：

df.set_index('col1', inplace=True)

def find_yes(df, x):
    return df.columns[df.loc[x] == 'yes'].tolist()

full example 完整的例子

import pandas as pd

data = '''\
col1    x   y   z
A      yes  no  yes
B      no   no  yes
C      no   yes no
D      yes  no  yes
E      no   no  yes
F      yes  yes no'''

fileobj = pd.compat.StringIO(data)
df = pd.read_csv(fileobj, sep='\s+')

df.set_index('col1', inplace=True)

def find_yes(df, x):
    return df.columns[df.loc[x] == 'yes'].tolist()

print(find_yes(df, 'A'))
print(find_yes(df, 'B'))

Returns: 返回值：

['x', 'z']
['z']

Answer 4

One more option for you - how about using melt then groupby : 为您提供的groupby一种选择-如何使用melt然后使用groupby ：

from io import StringIO

import pandas as pd

data = StringIO('''col1    x   y   z
A      yes  no  yes
B      no   no  yes
C      no   yes no
D      yes  no  yes
E      no   no  yes
F      yes  yes no''')

df = pd.read_csv(data, sep='\s+')

m = df.melt(id_vars='col1')
matches = m[m['value'] == 'yes'].groupby('col1')\
                                .agg({'variable': list})

this gives the following dataframe: 这给出了以下数据框：

     variable
col1         
A      [x, z]
B         [z]
C         [y]
D      [x, z]
E         [z]
F      [x, y]

如果根据数据帧的行和列值满足特定条件，如何获取列标题？

问题描述

4 个解决方案

解决方案1
3 已采纳 2018-07-26 10:35:01

解决方案2
2 2018-07-26 10:32:02

解决方案3
2 2018-07-26 10:36:06

解决方案4
1 2018-07-26 10:45:10

如果根据数据帧的行和列值满足特定条件，如何获取列标题？

问题描述

4 个解决方案

解决方案1 3 已采纳 2018-07-26 10:35:01

解决方案2 2 2018-07-26 10:32:02

解决方案3 2 2018-07-26 10:36:06

解决方案4 1 2018-07-26 10:45:10

解决方案1
3 已采纳 2018-07-26 10:35:01

解决方案2
2 2018-07-26 10:32:02

解决方案3
2 2018-07-26 10:36:06

解决方案4
1 2018-07-26 10:45:10