[英]pandas data frame groupby column names
我的數據框名為:variants_gene_list:在此處輸入圖像描述
我想創建一個數據框,其中包含“基因座”、“AF_afr”和“AF_nfe”列中的所有數據,每個唯一基因的數據都不同 arrays。
我嘗試了以下代碼: variants_gene_list = data.groupby('gene').apply(lambda x: [list(x['locus']),list(x['AF_afr']), list(x['AF_nfe'])]).apply(pd.Series)
我得到了這個數據框:(目前,我只有一個基因) enter image description here
問題 -
回答第一個問題:
variants_gene_list[X].iloc[Y][Z]
輸入您想要的列名而不是 X,輸入行名而不是 Y,輸入列表的數組編號而不是 Z。
第二個問題的回答:
我認為沒有辦法在不丟失列名的情況下執行 groupby() function,唯一的方法是重命名。
variants_gene_list = variants_gene_list.rename(columns={0: 'locus', 1: 'AF_afr', 2:'AF_nfe'})
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.