pandas 數據框按列名分組

Question

我的數據框名為：variants_gene_list：在此處輸入圖像描述

我想創建一個數據框，其中包含“基因座”、“AF_afr”和“AF_nfe”列中的所有數據，每個唯一基因的數據都不同 arrays。

我嘗試了以下代碼： variants_gene_list = data.groupby('gene').apply(lambda x: [list(x['locus']),list(x['AF_afr']), list(x['AF_nfe'])]).apply(pd.Series)

我得到了這個數據框：（目前，我只有一個基因） enter image description here

問題 -

Answer 1

回答第一個問題：

variants_gene_list[X].iloc[Y][Z]

輸入您想要的列名而不是 X，輸入行名而不是 Y，輸入列表的數組編號而不是 Z。

第二個問題的回答：

我認為沒有辦法在不丟失列名的情況下執行 groupby() function，唯一的方法是重命名。

variants_gene_list = variants_gene_list.rename(columns={0: 'locus', 1: 'AF_afr', 2:'AF_nfe'})