簡體   English   中英

熊貓:如何獲取一列的所有值,其中另一列的值是特定值

[英]Pandas: How to get all values for a column, where another column's value is a specific value

我有一個包含sample_id和突變的數據框:每個樣品都包含幾個突變

sample_id    mutation
sample1      mutation_A
sample1      mutation_B
sample1      mutation_D

sample2      mutation_C
sample2      mutation_D

sample3      mutation_A
sample3      mutation_B
sample3      mutation_C

我希望能夠獲得說存在mutation_C的值。 但是,我想獲取該樣本的所有結果-

df.loc[(df[mutation] == 'mutation_C')]

收益:

sample_id    mutation
sample2      mutation_C

我如何獲取其余的sample2突變數據,所以:

sample_id    mutation
sample2      mutation_C
sample2      mutation_D

我一直在嘗試使用grouopby,但無法弄清楚如何獲得所有結果

首先過濾所有samples ,然后通過isin再次過濾:

a = df.loc[df['mutation'] == 'mutation_C', 'sample_id']
df = df[df['sample_id'].isin(a)]
print (a)

3    sample2
7    sample3
Name: sample_id, dtype: object

df = df[df['sample_id'].isin(a)]
print (df)
  sample_id    mutation
3   sample2  mutation_C
4   sample2  mutation_D
5   sample3  mutation_A
6   sample3  mutation_B
7   sample3  mutation_C

假設您還有其他數據,那么一個更整潔的想法是按照您的方式設置索引。 (我添加了一個df['value'] = 1的虛擬列)

>>> a = df.set_index(['mutation', 'sample_id'])
>>> a.sort_index()
                      value
mutation   sample_id       
mutation_A sample1        1
           sample3        1
mutation_B sample1        1
           sample3        1
mutation_C sample2        1
           sample3        1
mutation_D sample1        1
           sample2        1
>>> a.loc['mutation_C']
               value
sample_id       
sample2        1
sample3        1

如果您確實需要sample_ids作為列表,則可以執行以下操作:

>>> a.loc['mutation_C'].index.tolist()
['sample2', 'sample3']

不是您問的,而是另一個有用的觀點:

>>> df.pivot_table(values='value', index='sample_id', columns='mutation')
mutation   mutation_A  mutation_B  mutation_C  mutation_D
sample_id                                                
sample1           1.0         1.0         NaN         1.0
sample2           NaN         NaN         1.0         1.0
sample3           1.0         1.0         1.0         NaN

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM