簡體   English   中英

pandas 數據框按列名分組

[英]pandas data frame groupby column names

我的數據框名為:variants_gene_list:在此處輸入圖像描述

我想創建一個數據框,其中包含“基因座”、“AF_afr”和“AF_nfe”列中的所有數據,每個唯一基因的數據都不同 arrays。

我嘗試了以下代碼: variants_gene_list = data.groupby('gene').apply(lambda x: [list(x['locus']),list(x['AF_afr']), list(x['AF_nfe'])]).apply(pd.Series)

我得到了這個數據框:(目前,我只有一個基因) enter image description here

問題 -

  1. 如何訪問我創建的新 dataframe 中的軌跡/AF_afr 列表?
  2. 我創建的數據框中沒有列名,我缺少什么? 謝謝

回答第一個問題:

variants_gene_list[X].iloc[Y][Z]

輸入您想要的列名而不是 X,輸入行名而不是 Y,輸入列表的數組編號而不是 Z。

第二個問題的回答:

我認為沒有辦法在不丟失列名的情況下執行 groupby() function,唯一的方法是重命名。

variants_gene_list = variants_gene_list.rename(columns={0: 'locus', 1: 'AF_afr', 2:'AF_nfe'})

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM